PHP利用Discuz关键词服务器实现中文分词的解决办法
内容摘要
这篇文章主要为大家详细介绍了PHP利用Discuz关键词服务器实现中文分词的简单示例,具有一定的参考价值,可以用来参考一下。
文章正文
这篇文章主要为大家详细介绍了PHP利用Discuz关键词服务器实现中文分词的简单示例,具有一定的参考价值,可以用来参考一下。
感兴趣的小伙伴,下面一起跟随php教程的小玲来看看吧!
不同于使用自己的服务器进行分词,Discuz!在线中文分词服务是基于API返回分词结果的。在项目中,我们只需要一个函数即可方便地进行分词、关键词提取。以下是根据Discuz!在线分词服务API写的函数,测试可正常运行:
代码如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 | <code> /** * DZ在线中文分词 * @param $title string 进行分词的标题 * @param $content string 进行分词的内容 * @param $encode string API返回的数据编码 * @return array 得到的关键词数组 */ function dz_segment( $title = '' , $content = '' , $encode = 'utf-8' ){ if ( $title == '' ){ return false; } $title = rawurlencode( strip_tags ( $title )); $content = strip_tags ( $content ); if ( strlen ( $content )>2400){ //在线分词服务有长度限制 $content = mb_substr( $content , 0, 800, $encode ); } $content = rawurlencode( $content ); $url = 'http://keyword.discuz.com/related_kw.html?title=' . $title . '&content=' . $content . '&ics=' . $encode . '&ocs=' . $encode ; $xml_array =simplexml_load_file( $url ); //将XML中的数据,读取到数组对象中 $result = $xml_array ->keyword->result; $data = array (); foreach ( $result ->item as $key => $value ) { array_push ( $data , (string) $value ->kw); } if ( count ( $data ) > 0){ return $data ; } else { return false; } } </code> |
代码如下:
1 | <code>http: //keyword.discuz.com/related_kw.html?title=高三历史全程复习精品教程&content=&ics=utf-8&ocs=utf-8</code> |
返回的XML数据:
代码如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | <code><?xml version= "1.0" encoding= "utf-8" ?> <total_response> <svalid>36000</svalid> <keyword> <info> < count >1</ count > <errno>0</errno> <nextuptime>1291287160</nextuptime> <keep>0</keep> </info> <result> <item> <kw><![CDATA[高三历史]]></kw> </item> </result> </keyword> </total_response></code> |
注:关于PHP利用Discuz关键词服务器实现中文分词的简单示例的内容就先介绍到这里,更多相关文章的可以留意
代码注释