SemTech 2011
Categories: 微日记, 语义网
Time: 2011-06-10
Original url: http://baojie.org/blog/2011/06/10/semtech-2011/
去SemTech转了几天。没有特别系统的想法,一些零散的写在微博上,整理如下。
[2011-06-10] 什么时候仓老师有foaf了,语义网就算是普及了
[2011-06-10] 普通用户那里来的数据,肯定不是通过加语义标签这样的方式。大多数,应该是用工具在不影响用户的正常工作模式的情况下,自动记录、提取的。大多数数据,应该不是从自然语言来。吃饭也是数据,睡觉也是数据。不必纠结这些数据是不是有语义。只要有了结构,再过十年再加语义进来也不晚。
[2011-06-09] #SemTech# OWL2现在就是一个小众自娱自乐的东西。当然,3年前许多人就这么看了。现在和搞TripleStore的聊,QL/EL,没见谁严格按规范来实现(比如QL+owl:sameAs)。Stardog也没做OWL2DL,底子还是Pellet,新功能主要还是TripleStore。RL说简单,实现起来计算复杂性还是高。RIF何时能用,更要至少好几年
[2011-06-09] #SemTech# 晕晕地睡了一路飞机回来,想语义网这个领域,钱从哪里来,到哪里去。90年代那么多Lisp公司,退潮时候基本全死掉,Franz居然现在还活着,一年500万,还不错。过几年这一轮IT泡沫破掉(Solomo泡沫),哪些方向能活下来,哪些行业会转型?
[2011-06-09] #SemTech# Google这种公司对语义技术还是比较关注的。如果结构化数据能提高搜索精度or覆盖度5%,那就很有价值了。以前主要用机器学习,现在有更多结构化数据(3年前还没有),渐渐可以做一点“语义”搜索了。Freebase可以猜搜索的意思,比如“张三演的电影”还是“张三导的电影”,比Powerset清楚多了。
[2011-06-09] #SemTech# 到底语义技术有没有前途?这三天下来,我觉得还是可以乐观的。关注的程度,工业界的投入,还是很可观的。不过,看参展厂商的产品,到底用多少RDF,我觉得并不是关键。目前的做法,还是结构化数据,把非结构数据结构化,或做结构化数据的集成等。W3C蛋糕模型的地位,大概和网络七层模型一样。
[2011-06-09] #SemTech# 昨天去参加了三藩的Semantic Web Meetup。四个演讲,SMW+, Dydra, SPIN and the LinkedIn。Dydra和LinkedIn以前不知道。不过LinkedIn那个,讲Faceted Search,是Structured Data。到底结构化数据和语义数据有多少区别,这个见仁见智了 http://t.cn/aK7t1W
[2011-06-09] 正解。Watson的成就,是部分建立在无数的Freebase和Wikipedia用户提供高质量数据的基础上的。如果我们衡量人年/MillionTriple,一定是一个惊人的数据。对于企业,这是必须降低的成本。现在的问题不是定性地说语义有没有用,而是有多贵。当然,这是一个“好”问题。
[2011-06-09] #SemTech# TripleStore现在算是可以用了, Franz的AG可以处理300G triple了,正在往1T奔。Dydra是一个免安装的TripleStore, 云在Amazon上,只要你给一个URL,就可以做SPARQL。BTW,Franz现在有差不多40个人了,算上contractors
[2011-06-09] #SemTech# 听了SemTech的若干报告, 总得来说,还是很糊涂,不知道这些忽悠靠谱不靠谱。Watson看起来很靠谱,我很想多看到这种级别的工作。有些以前看来很有前景的方向,比如semantic wiki,现在也有点冷了。当然,永远不缺新概念。总之,加深了我印象,没有高质量数据,啥也别谈http://t.cn/aK7Ghj
[2011-06-08] #SemTech# 听了Aditya Kalyanpur关于Watson的报告。印象最深刻的是在80% Recall时,结构化数据可帮助提高precision 10个百分点(大概75%到85%)。虽然只有2%的问题可以直接从结构化数据得到答案,结构化数据的辅助作用不可忽视。说SW是Web基础设施,我看,应该是part of基础设施 http://t.cn/aK7UbT
[2011-06-08] SemTech笔记。为什么金融需要语义技术。1) 灵活的数据组织而不是一个固定的schema; 2) Bussiness Rule不是固化在代码中而是作为知识来表现; 3) 打破数据壁垒,便于数据集成。
几个RPI去的人
左起: Li Ding, Zhenning Shangguan, Deborah L. McGuinness, Joshua Shinavier, Jie Bao, Evan Patton, Dominic DiFranzo