居于Unicode编码词典的php中文分词器
1、只适用于php5,必要函数 iconv
2、本程序是使用RMM逆向匹配算法进行分词的,词库需要特别编译,本类里提供了 MakeDict() 方法
3、简单操作流程: SetSource -> StartAnalysis -> Get***Result
4、对主词典使用特殊格式进行编码, 不需要载入词典到内存操作
DEMO
header("Content-type: text/html; charset=utf-8"); require('PhpAnalysis.php'); $content = "如果你受苦了,感谢生活,那是它给你的一份感觉;如果你受苦了,感谢上帝,说明你还活着。人们的灾祸往往成为他们的学问。"; PhpAnalysis::$loadInit = false; $pa = new PhpAnalysis('utf-8', 'utf-8', false); $pa->LoadDict(); $pa->SetSource($content); $pa->StartAnalysis( false ); $tags = $pa->GetFinallyKeywords(); echo "<div style=\"padding:60px;\"><b>内容:</b>{$content}<hr><b>分词结果:</b>{$tags}</div>";