1.多次选取中心点进行多次试验,并用损失函数来评估效果,选择最优的一组;


2.选取距离尽量远的K个样本点作为中心点:随机选取第一个样本C1作为第一个中心点,遍历所有样本选取离C1最远的样本C2为第二个中心点,以此类推,选出K个初始中心点;

3.特别地,对于像文本这样的高维稀疏向量,我们可以选取K个两两正交的特征向量作为初始化中心点。

参考链接:https://blog.csdn.net/liangtingac/article/details/48270233