用户大数据皮东的头像

大数据皮东

查看新浪微博主页
  • 用户头像

    大数据皮东

    #ADC2013#印象深刻的另一个报告是“RIGO的移动体验设计”,@Robin-Zhu 通过小米MIUI的设计案例从硬件,系统,软件,用户界面和产品推广等分享智能终端的体验设计。从我的角度,数据反馈和体验设计应该形成一个闭环,为了挖掘和满足用户需求。视野,目标,折腾不仅是优秀设计师,也是数据科学家的要求!
    展开全文
    原微博
  • 用户头像

    大数据皮东

    【大数据视点研讨会分享】百度余凯介绍了机器学习模型从Shallow model到Deep model的过程,特征决定了模型精度的上限,而深度学习的目的就是特征学习。百度深度学习研究院专注与深度学习和智能,并已经应用到搜索广告,人脸识别,图像搜索中 @余凯_西二旗民工
    原微博
  • 用户头像

    大数据皮东

    【大数据技术每日分享】【知识库】由命名实体的Facts,实体之间的语义分类以及实体之间的关系组成,可基于大数据自动构造。列举几个常用知识库系统,学术界:DBPedia, KnowItAll, Probase, ReadTheWeb, YAGO。工业界:Google KnowledgeGraph, IBM Watson QA system,Freebase, Trueknowledge
    展开全文
    原微博
  • 用户头像

    大数据皮东

    【大数据技术每日分享】【大数据机器学习】特征自动构造是关键问题,也是Deep Learning主要用途,今天讨论了非监督学习的特征构造方法:1)PCA主成分分析;2)Latent Feature Model:因子分析,SVD(矩阵分解);3)Topic Model:LDA;4)Deep Learning(DBN和DNN) @老师木 @邓侃 @张栋_机器学习 指正
    展开全文
    原微博
  • 用户头像

    大数据皮东

    【大数据技术每日分享】【Andrew Ng论机器学习】分享同事参加Andrew Ng清华演讲总结:1)监督学习中训练集的数据量大小很重要,越大越好;2)非监督学习中训练集的特征数量很重要,越多越好;3)机器学习应用的本质是特征工程;4)大数据机器学习,随数据量增加精度提高,不同模型最后比较的是计算能力
    展开全文
    原微博
  • 用户头像

    大数据皮东

    【大数据技术每日分享】受 @李沐mu 的好文启发,总结【大数据机器学习】发展趋势:1)人工特征工程+线性模型(通过海量样本可达到较高精度);2)自动特征产生和组合+线性模型(解决人工特征难以再获得来提高精度的问题);3)自动特征产生与组合+非线性复杂模型(其复杂计算对底层架构要求更高)
    展开全文
    原微博
  • 用户头像

    大数据皮东

    【大数据技术每日分享】【大牛论大数据】推荐数据库专家Michael Stonebraker有关大数据博客,相比大数据大分析(聚类,回归等复杂分析),重点讨论了大数据小分析(如Count,Sum,Max,Avg等SQL分析)的几种方案,列存储、压缩和查询抽样是关键。原文 🔗 网页链接 译文 🔗 网页链接
    原微博
  • 用户头像

    大数据皮东

    【大数据技术每日分享】【MapReduce应用实例】MapReduce适合在大量非结构数据上进行简单操作(如求和、提取属性值和简单统计操作),因此大数据分析中常用于挖掘的预处理(如数据装载,ETL和只读一次的处理),不适合于复杂统计和挖掘任务(如迭代和递归),具体实现实例推荐好文 🔗 网页链接
    展开全文
    原微博
  • 用户头像

    大数据皮东

    【大数据技术每日分享】科学界另一个必读文章是2012年初由美国的几个顶级数据管理大牛们联合发布的一份大数据挑战和机遇的白皮书。随便列几个:UC Berkeley的Michael Franklin, Stanford的Jennifer Widom, UIUC的Jiawei Han, Google的Alon, Yahoo的Raghu, 如雷贯耳,赶紧下载吧! 🔗 网页链接
    展开全文
    原微博
  • 用户头像

    大数据皮东

    今天上午确认了,当前版本的Greenplum HD确实是OEM MapR的,基本没什么区别。但以后会加自己的东西进去,这也是中国团队的主要任务,上海团队正在扩大,招Hadoop开发人员,感兴趣的同学关注下 //@皮东chen: 回复@fcicq: 有区别的,明天我再问问Andrew确认下
    展开全文
    #大数据# Greenplum Hadoop与Apache Hadoop区别:1. 更快(2-5倍,优化文件系统,重写HDFS) 2. 更可靠(分布式Name Node,Job Tracker HA,快照Snapshot,镜像Mirroring)3. 易用(支持NFS进行随机读写,简化的管理功能) ,这样可以使Hadoop在企业商用。
    展开全文
    转发 1评论 0
    原微博
  • 用户头像

    大数据皮东

    #大数据# Greenplum Hadoop与Apache Hadoop区别:1. 更快(2-5倍,优化文件系统,重写HDFS) 2. 更可靠(分布式Name Node,Job Tracker HA,快照Snapshot,镜像Mirroring)3. 易用(支持NFS进行随机读写,简化的管理功能) ,这样可以使Hadoop在企业商用。
    展开全文
    原微博