licstar
查看新浪微博主页licstar
mikolov进谷歌之后瞬间发了一大堆关于词向量研究的论文。继年初公布的词向量存在语义线性平移关系(king-queen=man-woman),年中发布的快速训练词向量的工具包word2vec之后,最近又公布了一个重大发现,不同语言单独训练的词向量,同义词之间仅仅是线性变换的关系 🔗 网页链接 展开全文原微博 licstar
今年NIPS上Tomas Mikolov自己以及曾在Hinton组待过的Andriy Mnih各发一篇文章对word2vec做了改进。所用方法的核心貌似都是Noise Contrastive Estimation。又有新东西学了。 原微博 licstar
《为什么皮皮虾是我最喜欢的生物》 见过最有趣的科普漫画~~赞石涵的翻译🔗 网页链接 ,仿照原版重新排版了一下。(英文原版 http://t.cn/zTq411c) @果壳网 @果壳自然控 原微博 licstar
我发表了博客:《维基百科简体中文语料的获取》。主要使用了Wikipedia Extractor抽取正文,opencc做繁简转换,并做了一些适当的后处理。 水文一篇,希望有人能用得着 🔗 网页链接 原微博