训练样本 - cyberCoder

1696321573

我想了解一下线性判别分析算法与逻辑回归的异同点，这两种算法在机器学习中都是常见的分类算法。线性判别分析算法是一种监督学习算法，通过对数据进行降维和分类，来实现对未知样本的分类。而逻辑回归算法也是一种监督学习算法，其主要用于解决二分类问题，并通过学习训练样本来获得...

提问者：藏在心底的梦

1688145577

我想请问一下逻辑回归模型中随机梯度下降和批量梯度下降的区别，因为我在实践中遇到了一些问题。目前我了解到，在批量梯度下降中，每次迭代都需要使用整个训练数据集进行计算，计算代价很大；而在随机梯度下降中，仅使用一个训练样本来计算梯度并进行参数更新，计算代价较小。但同时...

提问者：Enchanted_Garden

1688123925

我正在学习决策树算法，但现在遇到一个问题，就是训练样本不均衡时该怎么处理？我的数据集中，某些类别的样本数量远远大于其他类别。我使用决策树算法训练模型时，容易出现过度拟合和偏差较大的问题，导致分类效果不佳，甚至无法识别少量的低频类别。请问有哪些解决方法或技巧可以解...

提问者：AQUARIUS_88

1686983593

我在进行机器学习的时候，面临着选择一组有代表性的训练样本集的问题。我不想使用过于庞大的样本集，因为这会导致训练时间变慢；同时也不想使用过于简单的样本集，因为这会不足以覆盖模型可能出现的各种情况。我该如何选择一个具有代表性的训练样本集呢？是否有任何技巧或常用的方法...

提问者：独舞天涯

1686841653

我对k近邻算法的了解是，当数据集很大且特征数很多时，通过暴力计算每个查询样本与所有训练样本之间的距离，计算量会成倍增长；此外，如果要在密集区域外的数据集中进行查询，算法运行时间也会增加。那么，我想了解如何解决这个问题？是否有一些技巧和方法可以使用，以减少算法的计算...

提问者：Mirage_Fighter

1686204126

我在学习决策树算法时，发现在预测过程中无法考虑当前标签距离训练样本的距离。我希望能够在算法中引入这个因素，以提高预测准确度。是否有相关的方法或技巧可以达到这个效果呢？如果有老师或专家能够指导我，我将不胜感激。 ...

提问者：Golden_Gate

1686189692

我在进行分类问题时发现有些类别的训练样本数量太少，这导致了k近邻算法不能正常工作。我想请问一下，有没有什么方法可以在这种情况下使用k近邻算法来进行分类呢？是否可以使用一些方法来增加训练集中样本的数量或者对训练集进行一些预处理？是否有其他更好的算法可以替代或与k近邻算...

提问者：Dark_Angel