用户章成志的头像

章成志

查看新浪微博主页
  • 用户头像

    章成志

    若做N-Gram,目测规模可能比Google N-Gram大,但质量不一定就高很多 //@绝对零度nju: 训练个lm也不一定能提高了 //@章成志: 默默地转走...
    这个数据集够大,26亿网页, 183TB (注意是T不是G). 只有2T硬盘的表示只能转需 🔗 网页链接
    1. 微博附图
    转发 73评论 12
    原微博
  • 用户头像

    章成志

    科普:在美国和加拿大,安珀警戒(AMBER Alert)是当国内确认发生儿童绑架案时,透过各种媒体向社会大众传播的一种警戒告知。“AMBER”是“America's Missing: Broadcasting Emergency Response”(直译为:美国失踪人口:广播紧急回应)的缩写, 🔗 网页链接
    展开全文
    突然手机上冒出这个消息,伴有长鸣,震动,和语音提示。吓了一大跳!原来是美国政府的AMBER alert系统。顿时觉得那种远程让你手机电池爆炸的传言也未必不是真的… 我在:美国Baltimore
    1. 微博附图
    转发 2评论 0
    原微博
  • 用户头像

    章成志

    在北上广,四环内(地理意义上)的two houses才是真土豪!//@白硕SH: 顶一下two houses。
    #译事杂谈# “土豪”在网络上意指喜欢炫富、爱装B、穷摆阔的“很土”的富豪,很多在线词典用local tyrant 明显不合适,国外报章用local tyrant时指的是像薄熙来这样在当地一手遮天的人,跟我们平常调侃讽刺的“土豪”完全不是一个概念。薛蛮子是大富豪,但他不土,而且貌似很有文化,可惜他没权势。
    展开全文
    转发 851评论 86
    原微博
  • 用户头像

    章成志

    //@官山程序员: 提取的中文结果是简体和繁体混合的,可以用opencc的工具简单处理一下即可变为简体。http://t.cn/zTVrvBf清才-草堂: //@韩先培: nice!//@章成志: 转发微博
    想用wikipedia的NLPer们有福了,又发现一个抽取wiki内容的工具,很好用,特别因为是Python写所以修改很方便(比较于使用Perl写的wiki-miner),试用了中文wiki的dump数据跑,没有发现问题。项目Wikipedia Extractor地址:🔗 网页链接
    转发 1评论 0
    原微博
  • 被微博屏蔽
    用户头像

    章成志

    【小秘书成为科研对象】美国三所高校的计算机科学家研究微博小秘书姗姗的工作,发现:1)小秘书高效:30%被删除的微博都是在5-30分钟内,2)一转梅现象:越长被删的人,被删的越快,3)高科技小秘书:若全部人工,则需要4200名小秘书,因此判断必定是人+算法。全文:http://t.cn/zYE9LoT。
    展开全文
    1. 微博附图
    转发 505评论 243
    原微博
  • 用户头像

    章成志

    1. 微博附图
    原微博
  • 用户头像

    章成志

    关于信任传递,有两种形式是可靠的:1. 依靠权威;2. 依靠自己本来就认识的,比如我创建一个幼儿教育的交流群,邀请的人都是我以前认识的,这样的圈子交流更加放心。 @徐志明 @梁斌penny
    原微博
  • 用户头像

    章成志

    转发 1评论 0
    原微博