- /陈利人: 定向抓取;信息抽取和归一;聚类;引用分析和CiteRank;AuthorRank/THU: 从@ArnetMiner 开发的真正体会是: 1. 语义信息抽取(Arnetminer提供作者元数据抽取) 2. 数据集成 3. 面向领域需求的深度搜索(领域垂直搜索的需求往往非常细腻、刻薄) 4. 数据全面和快速更新 (所有的学术搜索都败给了goo展开全文
刚看到@唐杰THU 关于学术搜索的讲座,突然想起这个我在Google时做的一个垂直搜索项目:法律案例搜索 🔗 网页链接 。大家知道这种搜索的难点在哪?