第1738章 第一步已经迈出去了 (1 / 10)
有学生举手。
“学姐,你说的这个,和图书馆的检索系统有什么区别?”
“区别在于规模。”贾瀞雯说,“图书馆的书是有限的,分类是清晰的。
但互联网上的信息是无限的,杂乱无章的,而且每时每刻都在增加。
我们的系统要能自动发现新网页,自动理解内容,自动判断重要性,还要在零点几秒内返回结果。”
台下响起低低的议论声。
另一个学生举手:“这个技术国外有吗?”
“有,但还不成熟,而且主要是英文的。”贾瀞雯按照陈浩教的说,“中文有中文的特点,我们需要自己的搜索引擎。
这是空白,也是机会。”
她翻到下一页PPT,上面是陈浩手绘的简单架构图。
“我们有三件事要做:第一,写一个能在网上自动收集信息的程序;第二,建立一个能快速查找信息的数据库;第三,设计一个能判断信息重要性的算法。”
The content is not finished, continue reading on the next page