Classification method and system for text messaging

本发明公开了一种短信文本的分类方法和系统包括:计算分布式文件系统HDFS上所有短信样本的特征向量;判断出HDFS上的短信样本未分类,根据计算得到的特征向量对所述短信样本进行分类;保存短信样本的类别和计算得到的特征向量,形成HDFS上的第一类库;将第一类库转换为流式计算系统支持的第二类库;流式计算系统根据第二类库对待分类短信进行分类。 本发明能够对短信文本进行实时分类。