贾瀞雯回到北京时是周一早上。



她没回家,直接拖着行李箱去了办公室。



团队五个人都在,正围在白板前争论什么。



看到她进来,所有人都转过头。



“贾总回来了!”



“陈总有什么指示吗?”



贾瀞雯放下行李箱,脱掉外套:“先说说你们这边的进展。”



李明赶紧汇报:“索引结构优化做了第一版,测试结果显示查询速度能提升百分之二十左右。



但有个问题,内存占用增加了。”



“分词算法呢?”



张涛接过话:“常见歧义解决了一部分,但遇到新的问题。



比如‘南京市长江大桥’,可以分成‘南京市长-江大桥’,也可以分成‘南京市-长江大桥’。



这种结构歧义,靠词典解决不了。”



贾瀞雯点点头,走到白板前。



她拿起笔,在空白处写下几个字:超链分析。



“陈总提出了一个新概念。”她转身看着团队,“叫超链分析。



简单说,就是通过分析网页之间的链接关系,来判断网页的重要性。”



五个人都愣了。



“链接关系?”王磊问,“什么意思?”



“一个网页如果被很多其他网页链接,说明它可能比较重要,比较权威。”贾瀞雯解释,“反过来,如果一个网页链接了很多重要网页,那它自己可能也是个枢纽。



通过分析整个网络的链接结构,我们可以给每个网页打分,这个分数可以用于搜索结果排序。”



会议室里安静了几秒。



李明眼睛慢慢亮起来:“这思路……太牛了。



等于是把整个互联网当成一个投票系统,每个链接就是一票。”



张涛也反应过来:“对!这样就能解决垃圾页面堆关键词的问题了。



那些垃圾页面不会被其他页面链接,分数自然低。”



“但实现起来很难。”王磊皱起眉,“我们需要分析整个网络的链接结构,这计算量太大了。”



贾瀞雯放下笔:“所以陈总说了,先做简化版。



不分析整个网络,只分析我们已收录的十万网页。



先验证这个思路是否可行。”



她看着团队:“陈总给了两周时间。



两周内,我们要做出超链分析的第一版,集成到排名算法里。”



任务定下来了,但怎么开始,谁都没底。



第一天,团队在查阅资料。



超链分析这个概念,国外有论文提到过,但没见到实际应用。



他们需要自己从头设计算法。



第二天,李明在白板上画出了第一版架构图:“我们需要建两个矩阵。



一个记录每个网页的出链

本章未完,点击下一页继续阅读

(1/3)

章节目录

重生87:开局截胡港岛女神所有内容均来自互联网,零点小说网只为原作者极地苍狼的小说进行宣传。欢迎各位书友支持极地苍狼并收藏重生87:开局截胡港岛女神最新章节