网站导航

新闻中心

当前位置:主页 > 新闻中心 >
“大数据+人工智能”助力精准诊疗实现
时间:2017-10-31 11:24 点击次数:
主讲人:齐红威
主持人:刘东华
承办:中关村大数据产业联盟

    齐红威,数据堂(北京)科技有限公司创始人、总经理。2004年,获中科院自动化所人工智能与模式识别专业博士学位。2004-2011期间,NEC中国研究院,智能信息处理研究部部长,高级研究员。2006-2007年期间,斯坦福大学计算机系访问学者。中国计算机学会大数据专家委员会委员,中国计算机学会YOCSEF学术委员会学术秘书。
以下为分享实景全文:
    数据交易是个新兴的事物,存在很多争议和不明朗的环节,仅发表一下个人观点,供大家讨论批评。
我想从数据交易现状、数据分类体系、数据国家战略、政府与数据市场关系、数据交易的关键问题等几方面提供一些粗浅的信息,供大家参考。
一、数据交易的现状
    如果说20世纪是一个石油为王的时代,21世纪就是一个数据为王的时代,21世纪数据的价值有可能等同于20世纪的石油。当前,数据正逐步资源化和资产化已经成为业内共识。数据是原材料,具有原生价值。数据是原油,具有衍生价值。数据是资产,具有初次和再利用价值。数据是货币,具有交易价值。
    数据作为大数据产业的基石与原料,我们对数据在其各个加工环节所产生的价值的认识还处于初级阶段。如何对数据资产进行界定,如何促进数据有序地在其生产加工的各个环节中流动,如何有效地制定数据共享与流通的政策,这些问题都有待在实践中解决。
2012年以前,业内纷纷倡导数据共享,但经过这两年的讨论和实践,大家已经意识到不能打土豪、分数据,不能只承认价值而不承认价格的存在,数据交易是更符合事物本质的提法。
    先看一下国外数据交易的现状。如果说国内企业在2012年正式接受数据交易概念的话,国外已经在2008-2009期间开始进行数据交易的实践了。虽然早于国内几年时间,但国外也尚无知名公司(上市公司)。举几个典型的例子。
第一个是Infochimps,http://www.infochimps.com/marketplace。此网站2009年上线,从事数据交易,积累1.1万组数据集,2012年业务转型到大数据平台及分析,而后没有再扩大数据规模。
    第二个是Datamarket,https://datamarket.com/。此网站2008年上线,以统计数据为主,采用佣金(25%)或月租的商业方式。
    第三个是Factual,https://www.factual.com。此网站创办于2008年,提供涵盖本地服务、娱乐、教育和医疗等多个方面的数据集,按浮动价格向公司和独立软件开发商出售数据。类似的例子还有一些,我就不详细列举了。
    中国潜在的大数据资源非常丰富,从电信、金融、社保、房地产、医疗、政务、交通、物流、征信体系等部门,到电力、石化、气象、教育、制造等传统行业,再到电子商务平台、社交网站等,覆盖广泛。但政府所出台的公开数据的措施以及政策等却有待加强,已有的公开信息的政策有:《中华人民共和国政府信息公开条例》,之后基本没有在公开政府信息和开放数据中有具体政策措施。
再看一下国内数据交易的现状。
    科技部“科学数据共享工程规划(2002-2010年)”:气象、林业、水文水资源、地震、测绘、地球系统科学、可持续发展、农村现代科技信息共享试点。“十一五”期间,中央财政通过平台专项累计投入经费约29.1亿元。
2013年末,对于数据共享与交易,政府和行业突然热衷并行动起来。前两天,中关村大数据交易产业联盟成立,后续如何动作还有待观察。
国内也有不少企业在规划和尝试做数据交易的业务,尤其是金融、电商等行业内的企业。
二、数据的分类
    顺便插播一个小广告,数据堂创立于2011年,至今积累了4.4万组数据集,也做了一些数据交易的尝试。
    交易前,对数据合理的分类极其重要,因为对不同类型的数据可能要采用不同的处置方式。我比较赞同两种分类方式。
    一种是潘柱庭总(启明星辰)给出的分类方式。按照数据的性质分类,一是涉及国家安全及战略的数据,可看作是战略物资;二是由大众产生的,或公共事业产生的,无法明确版权的公共数据,类似于阳光空气,大众都享有使用权利;三是各种可供交易的商品数据。
    对于国家战略数据应该强调安全;对于公众数据则应该强调开放与共享;对于商品数据应该强调交易,以符合经济规律的市场方法发挥其价值。
    第二种分类方式是按照数据来源的方式分类。一是线下数据,如CPI指数要统计的商品的价格,这类数据散落于个体中,如想扩大采集规模的话,采集效率和成本都有不小的挑战。这类数据极其重要,需要有比较好的收集手段。二是网络数据,存在于互联网中,以公开的方式存在,考验的是数据抓取和抽取的能力,更本质的是考验图像、文本、语音等非结构化数据的结构化的能力。三是行业数据,存在于各个行业企业手中,能不能获取很大程度上取决于企业对数据的态度,隐私的限制,或政策的限制。四是政府数据,政府越来越开放,乐见其成,但对开放效率上要有耐心。
三、数据国家战略
    数据交易可做,但我们需要把数据使用提到更高的战略的层面考虑。这里面说的不对的地方大家指正啊。
    在激发创新之外,大数据也将带来数据安全与国家战略问题。云计算时代,大数据将超越国界的限制,数据将跨区域流动。然而,2013年6月由斯诺登事件曝光的美国棱镜门事件显示,美国国家安全局多年以来一直通过直接接入苹果、谷歌、微软、雅虎等几大互联网公司的中心服务器,获取大量    用户邮件、聊天记录、视频及登录信息。数据的跨国流动问题,不只是单个企业面临的问题,而是整个世界面临的大问题。工信部与外交部国际司等政府部门,应该尽早积极介入跨国数据流动的政策制定工作,介入得越早对我们越有利。
  因此,如果数据是石油,那么数据作为战略物资关系到国家的安全,而棱镜门事件折射出的数据对国家安全与信息保密的重要作用。为此,国家需要一方面制定符合经济规律的数据政策,另一方面应制定遵循安全战略的数据政策。
    所以,未来中国的数据战略需要扎扎实实地进行数据战略的顶层设计。在顶层设计的指导下,行业数据的需求通过竞争来倒逼促进共享与交易。企业、政府、行业根据各自的特点找准定位、有效区分,制定不同的数据政策。
除了在国家战略角度考虑数据安全之外,数据交易也涉及到个人数据隐私与安全。所以,在强调数据交易时应该对公开数据、私有数据等进行区别对待,未来大数据交易应该强调规则的制定。
    而在考虑个人隐私权的时候,应该照顾数据应用场景以及不同人对于其个人的数据共享时所持的不同态度。对于未来人们对数据隐私的态度越来越乐观,很多人认为下一代对于个人信息的共享会更加宽容与积极。
四、政府与数据市场的关系
    数据共享与交易涉及到商业模式、产业政策等诸多和市场、政府相关的问题。数据共享与交易不应由政府主导,政府应该承担其他角色所不擅长或不愿意承担的角色。而对于数据交易规则的制定以及数据交易的商业模式的探索,应该交由市场进行,在市场的博弈过程中逐步形成均衡,再由政府进行确认。
    十八届三中全会强调市场在资源配置过程中的决定性地位。在数据共享与交易的早期,政府的手不宜伸得过长,不然不利于数据共享与交易的健康发展。然而,政府有必要建立一些和数据开放共享相关的基本规则,以免发生混乱。
    对于一些基础性的、具有战略价值的、以及难以迅速产生商业价值的数据采集与共享,政府应当给予充分的重视与扶持。例如,孙九林院士多次提到的科学数据与空间数据在中国国家数据战略中占有重要的地位,国家与政府应该将这些数据的问题解决好。并且,政府数据的开放也是数据开放与共享中的重要组成部分,政府有必要探讨政府数据开放的方式并对其进行相应的投入。
五、数据交易的几个关键问题
    最后,国栋秘书长给我一个任务,要我提出几个数据交易中的难题大家讨论。这超出我的能力范围了,但数据交易的难题确实非常多。我列举几个,不一定说到了关键处,请大家集思广益。
    第一个是数据交易的机制。我更愿意把它叫做商业模式,即如何设计一种数据提供方、数据需求方、交易平台共赢的核心机制。当前大家基本都在采用分成模式。正如最初搜索引擎出现时也没有合适的商业模式,用户需要为其使用的搜索引擎服务进行付费,但随着互联网广告的出现,用户能够得到免费的高质量搜索引擎服务一样。数据交易有没有更好的商业模式?
  第二个是数据交易定价机制。数据的价值是因交易对象,因交易时间不同而不等的。该如何确定一个合理的定价模型?数据交易的价格应该由数据交易的双方共同协商确定?还是可能仿效股票与期权的交易市场或知识产权的拍卖行为开展定价研究?第三个是数据版权如何界定的问题。所有权是根本问题,数据交易做大规模后,版权会是核心问题。


24小时客服服务热线:4001616691

联系我们

Copyright © 2002-2020 北京中科新远科技有限公司 版权所有 京ICP备19012332号-1 京ICP备19012332号-1

地址:北京市-海淀区-上地信息路7号 昊海大厦305室