字体
关灯
上一章 目录 下一页 进书架
    第1741章 别被技术细节吓住 (5 / 10)

        “那中文分词呢?”她问,“这个他们觉得特别难。”

        电话那头沉默了一会儿。

        “这个确实难。”陈浩承认,“英文搜索可以直接按单词匹配,中文必须先把句子切分成有意义的词语。

        我们需要的不是机械切分,而是理解语义后的智能切分。”

        “怎么做?”

        “两种思路。”陈浩说,“一是基于词典,把常用的词做成词典库,然后匹配。

        二是基于统计,分析大量文本,找出经常连在一起出现的字组合。

        最好的办法是两者结合。”

        贾瀞雯记下最后几个字,笔尖顿了顿:“浩哥,这些概念你怎么都懂?你又没学过计算机。”

        陈浩笑了:“我是不懂具体编程,但我懂逻辑,懂原理。

  The content is not finished, continue reading on the next page
  • 上一章 目录 下一页