Posts Tagged ‘信息过滤’

2010年03月26日

关注数图情报和图书馆2.0有段时间了,整理行业牛人如下。
大佬

程焕文 http://blog.sina.com.cn/huanwen 中山大学资讯管理系博士生导师、传播与设计学院院长、图书馆馆长、图书馆与资讯科学研究所所长等职。图书馆界有“南程北李”的说法,“程”指程焕文, “李”指李超平。
李超平 http://www.mingzhiguwen.net/ 女,教育部高等学校图书馆学学科教学指导委员会副主任委员、浙江大学信息资源管理系副主任,“南程北李”之李。
老槐 http://www.oldhuai.name/ 范并思 华东师范大学图书馆系系主任,夫人胡小菁即“编目精灵”。
编目精灵 http://catwizard.net/ 胡小菁,老槐(范并思)的夫人。华东师范大学图书馆。原来做编目, 现在做数字化工作。

牛人

书丛老蠹鱼 http://blog.sina.com.cn/harvardduyu 沈津 哈佛大学燕京图书馆古籍部主任
图谋不轨 http://www.photowjx.com/blog/李鹏云 国家图书馆数字资源部
书骨精 http://blog.sina.com.cn/u/1412276081 王波,北大图书馆研究馆员、《大学图书馆学报》编辑,最早的图情博客
图谋 http://libseeker.bokee.com/ 王启云 淮海工学院图书馆(连云港)
图有其表 http://www.tuyouqibiao.com/ 顾晓光 数字图书馆论坛
蓝天白云 http://hi.baidu.com/blueyye 叶鹰 浙大信息资源管理系教授
秋禾话书 http://hi.baidu.com/nj_xuyan 徐雁 南京大学信息管理系教授
keven http://www.kevenlw.name/ 刘炜 上海图书馆技术大牛 语义网研究
奇正童话http://my.donews.com/leonz/ 赵亮 上海图书馆技术牛人
图林丫枝 http://cunfu.info/ [...]

Tags: ,,,,,,.
2009年06月2日

和图灵的刘江聊起信息过滤和分发,他推荐了两本书都是Manning的,很不错。
一本是《Programming Collective Intelligence》,在国内已有影印本和中译本,中译本名曰《集体智慧编程》。
《Programming Collective Intelligence》的副标题是Building Smart Web 2.0 Applications。打算重点看一下。下面是简介:

这本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。
全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息 并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习 和人工智能应用等。

还有一本是《 Collective Intelligence in Action》,与上一本相比,更着重介绍开源工具的使用上。目前中译本还在翻译。
这两本书只找到英文版,比较技术化,给程序员看的。在javaeye上找到chenjinlai的一组《Programming Collective Intelligence》读书笔记(1,2,3,4,5,6),打个前站。尽管不是程序员,还是打算读读,等啃完再追加阅读笔记。

Tags: ,,,.