字体
关灯
上一章 目录 下一页 进书架
    第1765章 遇到问题,分析问题,解决问题 (6 / 10)

        第二,迭代可以分批进行,不需要一次性算完。

        第三,分数不需要精确到小数点后很多位,整数就行。”

        贾瀞雯把这些记下来,转告给团队。

        李明听了,一拍大腿:“对啊!我们可以分块计算!先把网页按链接关系分组,组内迭代,组间再迭代。

        这样内存占用能降下来。”

        思路打开了,进展就快了。

        第一周结束时,他们做出了简化版的超链分析算法。

        测试数据很小,只有一千个网页,但结果令人鼓舞——重要网页的分数确实高,垃圾网页的分数确实低。

        第二周,开始集成到真实数据里。

        问题又来了:十万网页的链接关系太复杂,计算一次要八个小时。

  The content is not finished, continue reading on the next page
  • 上一章 目录 下一页