请问一下什么是信息熵?我正在学习决策树,并且看到这个概念,在理解它与决策树之间的关系时感到有些困惑。我知道它是用来描述信息的混乱程度以及随机事件发生的不确定性。但是我还是很难完全理解这个概念和它对决策树的影响。希望能有人能够用简单易懂的方式讲解一下。谢谢! ...