...

《网络信息技术发展趋势扫描服务》

  • 来源专题:网络信息技术发展趋势扫描服务
  • 编译类型:快报,简报类产品
  • 发布时间:2015-12-02
网络信息技术发展趋势扫描服务
  • 1. Oracle推出了众多云数据库服务
    杨真
    在Oracle全球大会主题演讲中,总裁Thomas Kurian推出了众多Oracle云上的大数据分析和数据管理服务。他宣布云服务关键产品不是已经可用就是很快可用了,它包括数据库、数据分析、数据管理和应用开发,以及Oracle现有的SaaS应用程序。 “我们不会强迫任何人迁移到云端,”Kurian在10月27日(星期二)于旧金山举行的Oracle全球大会主题演讲之后的问答环节中说。但他试图做到当客户准备接受云服务的时候,Oracle已经可以提供云服务了。一个措施是推出Oracle管理云组件,它能够在Oracle云中运行,并且企业用户可以对它进行开发。它还发布了带有很多数据处理和分析选项的Oracle云平台。Oracle云还包括:开发者代码打包和迁移的应用程序容器云,以及作为新的Oracle PaaS一部分的Python、PHP、Node.js、.Net 以及Java语言服务。 Kurian强调Oracle云将提供专用的单租户服务器,也会为有需求的客户提供多租户服务器。单租户的选择能够吸引具有隐私意识和安全意识的企业用户,而亚马逊没有这个选择。 作为Oracle高管,Kurian第一次指出哪些数据中心的资源是可用的。在过去的18个月中,Oracle在世界各地的19个地方建立了自己的数据中心。美国有六个,其中有两个为商业企业所使用,两个为美国国防部所使用,以及两个用于其他联邦机构。此外的数据中心一个在加拿大,一个在巴西,三个在英国,两个在德国,两个在欧洲,一个在新加坡,一个在日本,一个在澳大利亚。未提及的第19个数据中心位于红木海岸的Oracle加利福尼亚州总部。 Ramamurthy表示,该组件可以管理应用程序在任何当前应用程序基础设施上运行,无论是本地或远程环境。第一种服务——应用性能监控云服务,需要在应用程序上加载代理。第二种服务——日志分析云服务,将收集和分析来自Oracle产品和其它供应商的日志数据。第三种服务——IT分析云服务,聚集和分析其他两个服务收集的数据。

    发布时间: 2015-12-02

  • 2. 面向开放网络平台的便携式网络出版工作草案发布
    杨真
    W3C的数字出版兴趣组公布了面向开放网络平台的便携式网络出版工作草案。该文档介绍了便携式网络出版,它是对开放网络平台上基于文档完全原始表示的数字出版的展望。便携式网络出版实现了在线和离线/便携式文档发布的全面融合:出版商和用户不用必须从中选择其一,可以随意地在它们之间动态地切换。

    发布时间: 2015-12-02

  • 3. 联合国推出基于环境法概念与框架的开放获取信息门户
    袁慧
    联合国推出了法律与环境本体门户网站LEO(http://leo.informea.org),这一新工具旨在确保世界各地的决策者、公民和研究者能够及时获取最新的环境法。LEO提供了公约中的概念、定义和同义词以及不同的多边环境协定(MEAs)之间的关系。 关于法律与环境本体(LEO) LEO吸纳了ECOLEX,FAOLEX和InforMEA信息工具中超过105,000个国家法律法规、2,000个案例、近5,000个国家报告、500个行动计划、2,000多个全球、区域和双边环境公约和10,000个理事机构的决议。此外,还包括了地图、信息图表和文本。这是一个值得广泛称赞的电子学习工具,它可以让公众全面地了解多边环境协定。 这一新资源旨在通过开放现有环境法和程序信息的大多数方面帮助所有用户轻松访问这些信息。一方面鼓励新手如学生使用LEO,另一方面允许学术研究人员、非政府机构的资深工作人员、政府政策制定者、司法和环境新闻工作者开放获取环境法和协议方面的资源。 合作伙伴 这是联合国环境和法律团体第一次以这样的规模联合起来,提供可以免费获得并易于搜索的环境法方面的信息和知识。 参与开发并确保当前内容可访问和持续最新的合作伙伴包括联合国组织(粮农组织、教科文组织、联合国欧洲经济委员会、联合国环境署)、国际自然保护联盟(IUCN)、欧洲环境署(EEA)、国际可持续发展研究所(IISD)、法律应对计划(LRI)、联合国环境规划署、世界保护监测中心(UNEP-WCMC)以及涉及濒危野生动物、迁徙野生动物、生物多样性、遗传资源、荒漠化、气候变化、臭氧层协定和农业等方面国际贸易协定的专门机构和环境公约。 LEO在欧盟支持下开发并被广泛认可,在2015年9月15-17日举行的第6届信息和知识管理(IKM)MEA指导委员会会议上由六个全球性公约行政首长讨论并发布。 实例 LEO能够让研究人员根据使用的检索方式和专业技术水平快速获得某个主题的深度信息,预期影响效果非常显著。例如,一个小岛屿国家在准备一份海洋废弃物简报之前,必须要找出那些已经通过的海洋废弃物方面的环境公约,然后搜索每个公约的网站。 此前,类似的信息必须有一个明确的查询请求,这要求搜索者必须已经具备良好的业务知识基础方面。随着时间的推移,LEO将逐步改善,并在协调术语表和统一词汇标准方面取得进一步进展。

    发布时间: 2015-12-02

  • 4. 美国国家科学基金会: 建立数据科学的智囊团
    王园
    美国国家科学基金会(NSF)发布新报告称:访问、分析大量数据并从中产生深刻见解的能力已经驱动了从医药到制造各个领域的创新,它为我们的生活带来了更高的效率和更高的质量。为了加快这一新兴领域的发展,NSF宣布成立四个总计超过500万美金的奖项来为数据科学创新建立区域性Hub。成员由来自哥伦比亚大学 (东北部Hub)、乔治亚理工大学和北卡罗莱纳大学 (南部Hub)、伊利诺伊大学香槟分校(中西部Hub)和加利福尼亚大学圣地亚哥分校、伯克利分校和华盛顿大学(西部Hub)的顶级数据科学家共同组成。超过250个组织承诺随着时间的推移将会进一步拓展,这些组织来自大学和城市,以及基金会和财富500强企业,覆盖了50个州。该奖项构建在2012年美国国家大数据研究和发展计划的基础上,是通过大数据区域性创新Hub (BD Hubs)计划设立的,该计划为学术界、工业界和政府之间的多部门协作构建了一个新的框架。由这些Hub构成的“大数据智囊团”将构想、计划和支持区域性大数据合作,以解决区域性挑战。

    发布时间: 2015-12-02

  • 5. 加拿大研究图书馆协会(CARL)的Portage平台宣布推出数据管理计划(DMP)助手
    王园
    Portage于2015年5月正式启动,由加拿大研究图书馆协会(CARL)管理。Portage是国家的研究数据管理计划,它通过基于图书馆的RDM专业知识和国家平台的网络来协助研究人员规划、保护和发掘研究数据。作为其Portage计划的一部分,CARL于10月21日宣布推出DMP助手。这个国家的、开放的、双语的数据管理规划工具将为研究人员项目提供帮助。 数据管理计划是一个被国际研究团体广泛认可的最佳实践。DMP助手(法文Assistant PGD)基于一个通用模板引导用户一步一步通过一系列的问题指定研究数据管理管理计划。它对所有的加拿大研究人员是免费的,并提供专业指导以帮助研究人员利用工具制定他们的计划。它还提供满足特定资助者的DMP需求的选项或来自其他组织的使用模板。 DMP助手是由(英国)数字管理中心的DMPOnline工具演化而来,并托管在阿尔伯塔大学。法国用户界面在蒙特利尔大学图书馆的支持下制作。由一些来自加拿大大学的数据馆员组成了一个Portage DMP专家组,开发了通用数据管理模板,并与研究人员和其他利益相关者进行可用性测试。Portage DMP专家组主席Jeff Moon说:“这是一种建立在整个加拿大图书馆和大学中不断扩大的数据管理专业知识的基础上的协同努力。” DMP助手将从Portage网络获得持续支持,以确保它保持发展。 “我们很高兴地宣布推出这个富有价值的工具,以支持加拿大的数据管理,”Portage的主任Chuck Humphrey如是说,“这是Portage为研究数据管理构建一系列可持续的,实用的国家服务的第一步。”

    发布时间: 2015-12-02

  • 6. 美国图书馆协会最新技术战略方向:2016 - 2017
    杨真
    ALA在2016财年及以后的技术展望: • 让ALA会员容易找到ALA最新信息和历史信息,参与学习活动和社团,参与面对面会议之外的其他小组活动,便捷地购买商品和服务,定制他或她的ALA界面,通过虚拟讨论、轮询、投票和其他虚拟方式帮助把握协会的方向。 • 让公众找到关于ALA和图书馆的基本信息,获取图书馆的信息和倡议,加入ALA,并便捷地购买商品和服务。 • 为ALA和其单位提供用于数据驱动的决策和个性化营销的会员人口统计及其他信息。 • 实现ALA会员各方面信息、操作数据以及技术的隐私保护、安全机制和业务连续性(灾难防备和应对)。 • 改进技术资源让ALA员工更高效地协作,能够远程访问新资源和现有资源。 ALA技术服务图解: 图1 ALA ITTS为会员和员工提供58个服务点部分或全部服务管理与支持 在发现、实施和后续评估的迭代周期中,ALA ITTS正在解决以下现实问题,无论IT工作由员工完成或者外包,这些问题在可预见的未来仍将是巨大的挑战。 • ALA沉重的层级组织结构在修改标准体系时往往会造成额外成本,延长完成时间表,并增加维护要求。 • 协会业务过于复杂并缺乏标准性,在每个IT实现过程中必须经常讨论和修改。 • 如何协调整个协会有效利用创造性工作的优势以及最大限度地减少项目之间的重复或冲突面临着挑战。 • 预算经理们对新项目的IT影响或范围变化作为常规方案设计和预算执行一部分的看法有所不同。 2016财年,ALA在技术方面的主要举措包括以下几个方面: 1.网络业务 ALA主要网络服务包括:电子商务系统、Drupal网站内容管理系统、Shibboleth单点登录系统、Solr检索系统、eLearning门户网站、会员和客户资料系统、委员会任命程序、ALA Connect以及其他应用程序(如奖学金应用程序、奖/助学金数据库、电子请愿书、捐赠表格等)。ITTS计划在2015年12月部署一个新的响应网站模板,以满足日益增长的ALA资源访问需求。此外,在2016年,新建eLearning门户网站取代现有ALA在线学习门户网站(http://www.ala.org/onlinelearning/)。在以后的阶段,将门户网站向数据库后台转移,可以动态生成课程列表,允许基于特定会员兴趣的自动结果过滤,允许用户搜索课程,并提供将ALA产品广告植入在一门课程介绍页面的方法。 2017年,将开始着手为ala.org网站建立移动应用程序,让会员和公众方便地访问信息和服务,包括在所有设备类型上访问目前的会员信息、最常用的网页和会员续费。研究维护ala.org网站的软件迁移或替换为外部服务的方案,以减少员工在软件维护、升级和安全补丁上花费的时间。重新评估Shibboleth的使用情况,开发可替代的单点登录技术解决方案适用于我们所有基于网络的资源。 2.iMIS协会管理系统 该系统是数字化ALA的中心,也是多级ALA网站验证的主要数据来源,它能够捕获会员与用户交易费用、委员名册、小型活动(继续教育)、订阅和基金筹措情况。2016财年,iMIS协会管理系统将从iMIS 20.1版本升级至20.2版本。2017财年,将迁移到web门户,使全体员工可以从任何地方搜索和更新iMIS的信息。这将减少Citrix服务器的负载(以及许可成本)和减少在台式机上必需的软件维护和升级。 3.会费、捐赠和电子教学的电子商务系统 新的电子商务计划于2015年11月开始实施。新系统对所有用户来说将更加便捷,便于他们加入、续借,没有iMIS账户也能直接捐赠。用户可以通过单一购物车支付会费、捐赠和购买电子学习产品,基于类型、兴趣和专业给出视图推荐。2017财年,ITTS和出版业将探索如何使商店成为ALA电子商务的一部分并集成到其他服务如在线学习和ala.org网页中。 4.ALA Connect Connect是ALA为会员和非会员提供的专业协作和社区网站。新系统计划于2016年1月实施,将提供: (1)“我的CE”——一旦新的电子学习共享实施后,可以添加会员资料,让他们可以轻松地查找和跟踪他们ALA相关的在线学习。 (2)会员匹配——新系统将允许会员查找有共同兴趣、部门(圆桌会议)、地区、工作角色、专业领域等的其他会员。 (3)历史简历——ALA Connect文件已经在会员资料中显示了目前委员会和会费的隶属关系。新系统的未来阶段将会使会员资料成为全面的简历,可以公开补充完善简历。 (4)志愿者中心——Higher Logic系统的模块,替换了现有的志愿者申请表格,通过“志愿者承诺曲线”衡量会员从底层参与到领导位置的进步,并提供可用于在会员资料中授予会员贡献徽章和会员数字证书的应用。 2017年继续整合Higher Logic系统提供的新特性和新功能,通过使用API将新系统与ALA的机构知识库连接,以方便员工和会员能够长期保存重要内容。 5.会议管理 ITTS外包了会议网站、计划安排、注册网站和主站点的建设。2016财年,将继续部署新的事件管理系统,将ALA会议、部门会议和小型会议集成到新系统上去。管理程序创建、评估、发言者管理、满足会议室要求和分配、传递程序信息给会议调度的整个过程将得到简化。2016年仲冬会议上,将实现新移动应用可用。 6.财务管理系统 2016财年计划升级到微软最新版本的GP Dynamics,ITTS也会继续努力支持会计和财务功能的提高来改善ALA的财务流程、追求效率并提高生产率。2017财年,为了提供远程用户访问,ITTS和财务部门将调研使用Prophix外部托管版本的可能性。 7.电话系统 ITTS计划于2017年1月实施新的IP语音技术。将语音呼叫、语音消息、文本信息、电子邮件、会议和协作功能集成到一个平台上,电话设备和计算机共享一套布线方案。 8.网络基础设施 在2016财年,ITTS将继续淘汰遗留的IP地址范围以及DMZ和服务器交换机,计划启动IRF堆叠技术路由,评估内部和互联网带宽以及网络利用率,以规划任何需要的更改。评估现有无线解决方案的利用率和安全性,并实施相应的解决方案。计划分离入站和出站网络防火墙的流量,以提高整体性能和实施改进互联网连接监控和紧急通知及访问。 9.网络安全 在2016财年,将继续由第三方的服务提供商进行额外的定期监测,包括入侵检测和日志分析,主动阻止已知的恶意行为和事件。供应商也进行月度评估来清点、评估和提供新的和现有设备和服务的补救计划,以找出安全漏洞。此外,每年进行渗透测试,作为一个整体健康检查的一部分。 10.灾难恢复 在2016财年,计划完整实施DRaaS,快速直接激活保护在云托管虚拟基础架构的较新版本数据,通过一个简单的灾难恢复途径回归到正常状态。使用Veeam Cloud Connect虚拟机进行复制和灾难恢复服务,根据定义的时间表复制所有被认定的ALA虚拟资源到托管方离线存储。在发生ALA数据或服务器无法访问的灾难时,可以连接到托管方,几乎立刻激活保存副本。旧的基于异地磁带或备份的方法往往需要较长时间重建基础设施和恢复备份。这个新方案可以减少停机时间到几分钟,减少会员服务、营收和员工工作效率的影响。

    发布时间: 2015-12-02

  • 7. 数据集成公司Informatica启动大数据管理平台
    王焱弘
    数据集成公司Informatica宣布建设“大数据管理”平台。该公司表示,其数据集成服务将会增加数据质量、统筹管理和安全性等特性。据该公司介绍,这一系统会增强大型企业应对数据管理问题的能力,进而有助于扫清落实大数据项目的困难。Informatica称:“手工编码和大数据技术不但昂贵,而且也很难实现,新平台极大地减少了对它们的需求。” 此外,该公司CEO Anil Chakravarthy还表示:“数据不再是业务的副产品,它本身就是业务,而只有Informatica提供大数据端对端数据管理服务。”在最近的采访中,Chakravarthy 还提到:“我们本质上还是个数据公司,目前的工作重心是大数据。而数据安全还是一个新领域。当下,有难以计数的资本涌入网络安全领域,但该领域的问题仍然没有解决。” Informatica执行副总裁兼CPO Amit Walia回应称:“75%以上的用户仍然在努力从大数据中提炼出价值,所以我们致力于帮助这些组织克服这一道路上的险关。” 案例研究:KPN 据Informatica介绍,他们的大数据管理系统有三大支柱:高效的大数据获取能力;数据质量和统筹管理;数据安全等级。 荷兰电信公司KPN是该系统的早期用户。KPN首席架构师Thomas Reichel表示:“KPN作为一个数据驱动型企业,大数据管理在公司运作中扮演着至关重要的作用。大数据集成打破了信息孤岛,提供了更优质的客户情报。大数据统筹和质量管理确保了我们的业务分析师能获得可信的数据。另外,欧洲关于敏感客户信息有严格的监管法律,这更要求我们具备监测敏感信息的能力。因此,我们需要大数据安全,通过风险分析和基于政策的风险数据保护,来为我们提供对敏感数据全方位的监管。我们正在运用综合手段推进KPN的大数据管理事业。”

    发布时间: 2015-12-01

  • 8. 欧盟委员会欢迎E-CAM成为新的电子基础设施卓越中心
    袁慧
    下一代超级计算技术和应用使得欧洲数万的研究人员可以使用大规模并行超级计算机来解决不能在实验室中解决的科学问题。在征集e-infrastructure计算应用卓越中心的倡议下,E-CAM将成为八个计算应用卓越中心(CoEs)之一,加强欧洲在现有的高性能计算(HPC)应用方面的领导地位。 高性能计算技术对欧洲的创新能力是至关重要的,超级计算越来越成为各领域研究人员使用的重要工具,从基因组学和生态学到医学、工程和教育学。 E-CAM将通过以下三个互补性手段建立、发展和维持一个欧洲基础设施,以使得计算科学能够应用到工业和社会利益相关的材料和生物过程的仿真和建模方面: 1、针对最终用户需求的软件开发与宣传; 2、进一步培训当前和未来的学术和行业研究人员利用这一软件和相关的软件支撑标准; 3、多学科,应用咨询服务以支持产业最终用户(无论是大型跨国公司和中小企业)进行仿真和建模。 E-CAM项目将直接通过横跨欧洲的18个机构开展工作,其中包括四项国家超级计算机中心和工业协会(包括跨国公司和中小企业)。该项目将涉及很多研究人员、科学家和工程师,并将密切配合其他卓越中心和欧盟举措以帮助发展欧洲计算科学的生态系统。项目由欧盟共同出资,预算达480万欧元将花费60个月时间。

    发布时间: 2015-12-02

  • 9. Web标注数据模型草案发布
    杨真
    W3C的Web标注工作组发布了Web标注数据模型工作草案。标注通常用于表达资源或资源之间的关联信息。简单的例子包括单个web 页面或图像的评论或标签,或者是关于一篇新闻报道的博客。Web标注数据模型规范描述了一种结构化的模型和格式,使得注释能够跨不同的硬件和软件平台共享和再利用。普通的用例可以被简便的建模,并且同时实现更复杂的需求,将任意内容链接到指定数据点或多媒体资源时间段。该规范提供了一个包含这些用例的概念模型以及表示概念模式的术语表。建议使用指定的JSON格式以便于创建和使用注释。

    发布时间: 2015-12-02

  • 10. EBSCO信息服务PrepSTEP帮助学生为未来做准备
    王园
    为满足大学生和即将步入职业生涯学生的迫切需要,EBSCO推出了PrepSTEP平台,它是一个可以在学校内外帮助学生培养技能、塑造自己未来的在线学习平台。 PrepSTEP是一系列学术和职业相关资源的独特集合,可以提供阅读、写作、数学、科学、基本计算机以及工作等方面的技能培训,并且可以为一些重要考试做准备,比如高中学历、大学招生以及职业许可等。目前提供两种满足每个学生特殊需求的方式:两年制专科和技术学校、四年制大学。高中版也即将推出。PrepSTEP由屡获殊荣的教育软件提供商LearningExpress及EBSCO联合开发的。 PrepSTEP具有丰富的容易使用的交互式教程、测试练习和电子书,学生可以在任何时候、任何地方使用带有浏览器的设备在线获取这些服务。它可以提供学生们自主学习需要的工具;为发展计划进行技能培养补充;培养在时间管理、沟通和其他工作所需的软技能;以及在一些当今最受欢迎的职业中的测试准备和职业信息。这样的个人投资组合将对学生的工作与提升大有裨益。 最近的研究表明,近60%的大学新生需要补习课程。PrepSTEP旨在为他们补习课程、自主提升技能和测试准备等提供补充资源,以帮助他们在大学测试获取高分,并保持完成计划所需的节奏。LearningExpress总经理和首席运营官Kheil McIntyre说:“PrepSTEP 是一个伟大的方式,它可以让院校帮助学生迎接各种准备活动、复习课程等挑战,并对他们的成功有重要意义。”PrepSTEP还为高校提供额外的机会,可以改变学生的未来并帮助他们走向成功。

    发布时间: 2015-12-02

  • 11. 成功实施Hadoop的10个优先事项
    袁慧
    开源的Apache Hadoop是一个使用简单编程模型的、跨集群的大规模数据分布式处理框架。换句话说,这是一个大数据,数据仓库和大数据分析工具。数据仓库研究所(TDWI)一个最佳实践调查报告中指出计划在生产中使用Hadoop集群的企业数量大幅增加。到2016年第一季度,受调查者在生产中使用Hadoop的数量将从今年早些时候报告的16%提升到60%。进一步加强Hadoop作为未来的一个企业级工具,排斥Hadoop的组织已经从2012年的27%下降到6%。 基于这样的速度,TDWI预测五年内Hadoop将成为主要的实践方法。根据Hadoop在企业中的应用汇总的调查结果,TDWI提出了一份包含10个重要事项的清单(他们称之为建议,要求或规则),它可以帮助新的企业从Hadoop中获得最大的利益。 1:要以开放的姿态对待Hadoop和其他新选择 企业应接受使用开放源代码,接受分析、数据结构和来源的新形式,以及利用大数据的新企业方法。TDWI写到:“你可以拥抱和引导变革并因此而进步,也可以保持现状与机会擦肩而过。” 2:在企业级Hadoop大数据的基础上创新 89%TDWI调查受访者认为Hadoop是一个创新的机会。该报告的作者建议使用Hadoop来扩大数据挖掘和统计分析数据样本,使用社交数据完善客户视图,并利用Hadoop的低成本来创新企业预算编制,基础设施配置和资金。 3:基于Hadoop在业务和技术需求上的应用 TDWI认为Hadoop的任意一个好处——先进的分析,大数据的利用,数据的探索,延长较旧的数据管理平台,归档,控制成本——都有足够的吸引力来认真考虑它。报告中他们还补充说:如果你的组织有这些需求,他们将引导你使用更深入的企业级Hadoop。 4:了解障碍,以便你可以跨越他们 报告中所描述的障碍包括:业务支撑薄弱,安全问题,以及过度手工编码。TDWI写道“永远不要让这些阻止你”。受访者有办法解决这些问题,并且Hadoop生态系统的持续发展正在努力解决这些障碍。 5:对Hadoop和大数据管理(也许是新职员)进行培训 公司应注重培训和招聘数据专家——数据分析师,数据科学家以及数据架构师——这些人可以开发数据探索,分析,归档和内容管理的应用程序。该报告的作者写道:“如果有疑问,雇佣和培训数据专家来进行大数据的管理,而不是应用专家。”当TDWI问到受访者如何配置Hadoop职员时,73%的受访者正在对现有的员工进行培训; 41%的受访者正在招聘有相关经验新员工; 36%的受访者正在使用咨询顾问。 6:增选Hadoop来重新考虑数据和内容架构的经济性 报告受访者描述了他们是如何在他们的环境中开发多平台的,每个平台都是特定工作负载和用户需求中同类最佳的。这也导致了新的成本模型,企业可以直接通过成本最低的平台完成数据处理工作。“Hadoop的低成本是在本企业范围内变更IT组合和架构的主要驱动力”,数据仓库研究所写道。 7:通过定义架构中Hadoop的位置来为混合数据生态系统做准备 TDWI认为Hadoop“企业价值”的应用案例将会越来越被新用户理解。较为成功的“启动器”使用案例包括:在数据仓库环境中分段运输,使用Hadoop作为大型数据集的共同位置点以促进广泛的数据探索,进行高级数据分析处理,以取代陈旧的档案,并作为内容管理系统的延伸。 8:考虑Hadoop在普遍的BI /DW和分析应用之外的使用情况 BI/DW代表商业智能和数据仓库。作者写道:“存档和备份系统在大多数公司已经变得过时和无效。”Hadoop的低成本和可扩展性使其使用案例有吸引力。根据调查的受访者反映,其他的使用案例包括:内容管理,文档管理和记录管理。 9:寻找使Hadoop数据呈现相关性的功能 包括基于SQL的分析,关系型功能是企业采用Hadoop的必不可少的功能,因为高配置的用例需要它们。很多厂商和开源组织正在开发改进使Hadoop对SQL有更好的支持,该报告的作者强调这些改进不会减损Hadoop作为一个NoSQL平台的“独特能力”。“Hadoop的强大之处是,它支持多种方法和多种类型数据的能力”,TDWI写道。并补充说,以这种方式“Hadoop几乎每天都在变得更加多样化。” 10:开发和应用企业级Hadoop策略 最后,对Hadoop不熟悉的组织应该从概念验证(POC)项目开始,该项目将评估多个用例的商业价值。其出发点可能包括探索,发现和分析大数据的具体形式。该POC团队还可以测试数据仓库扩展、归档、内容管理和存储配置的能力。作者写道该POC项目的最终目标是“创造基于Hadoop的应用程序并最终横跨整个企业。”

    发布时间: 2015-12-02

  • 12. 想找到不同国家的开放数据吗?试试欧洲数据门户吧。
    王焱弘
    欧洲数据门户项目(European Data Portal)建立在全新的泛欧洲开放数据基础设施的发展之中。据了解,项目启动于卢森堡召开的欧洲数据论坛期间。其目标是为欧盟及其它国家提供一个可以访问欧洲各国政府发布数据的网关。它将支持公共行政机构将数据发布为开放数据,并采取有针对性的行动以促进数据再利用。看到一些国家在欧洲数据门户发布的开放数据,未曾列入优先考虑范围的各国政府也可以得到启发,开放他们的新数据集。开放数据的再利用可以进一步推动经济,其受益范围从改善公共行政机构效能、促进私营部门经济增长到更广泛的社会福利。欧洲数据门户团队估算了从2016年到2020年的经济增长,开放数据的市场规模预计将在2020增长36.9%价值达到757亿欧元。 只有开放了,数据才可以被再利用 当前,该门户涵盖了来自34个欧洲国家、超过24万的数据集。这些数据被划分为从农业到交通的十三个类别,包括科学、司法、健康等等。用户可以按照分类快速浏览。为方便利用这些多语种数据,该门户建立了跨语种搜索界面。此外,它还采用了机器翻译技术,对元数据和重要的数据描述进行翻译。这将有助于用户(开发人员、企业、新闻工作者和感兴趣的公众)找到所需要的数据。如此一来,数据的再利用将变得容易得多。 许可条件自动助手 另外,该项目正在对许可条件的自动助手开展试验来帮助用户理解数据的许可条件。一些公共行政机构会规定某些数据的许可条件,因此,门户在集成来自不同数据源的数据时,可能会遇到资源之间许可条件冲突的情况。而许可助手可以帮助用户了解某一数据集附加的许可条件。 看到此处,如果你依然对什么是开放数据毫无头绪,甚至干脆认为它太过复杂而放弃使用,那么你可以参考以下的建议: •参考欧洲数据门户公布的在线指导模块 •阅读可利用数据的清单 •如欲发布数据,请阅读数据发布者指南 •随意浏览,找到所需数据。门户为许多数据配备了可视化工具,能够帮助用户快速理解数据 •在浏览数据时,可利用门户提供的绘图程序,绘制数据图表 •某些数据面向的是专业开发人员,因此对普通用户来说利用难度较高。 从宏观角度审视,欧洲数据门户是欧洲数字化统一市场(Digital Single Market)的组成部分。实现统一市场正是欧洲当前十大愿景之一,而自由的数据流是促成这一目的的关键策略。此外,欧洲数据门户也是连通欧洲设施(Connecting Europe Facility)的关键因素,它将成为数字统一市场发展的有力支撑。

    发布时间: 2015-12-02

  • 13. PLOS和DBpedia:一个关联数据实验
    王焱弘
    PLOS上发表的文章覆盖了极其广阔的学科范围。目前,已经有10,767个学科领域术语可用于对文章进行分类,这是PLOS决定扩展其词表的关键原因。令我们好奇的是,是否可以利用匹配软件建立PLOS学科领域与外部数据集中对应术语之间的关联。而这些关系将有助于在建立数据源之间的链接,同时有利于PLOS的资源被更多公众利用。所以,我们决定试着为PLOS词表中的每个术语增加一个字段,即外部数据源的链接,也可以描述为“the same as”。如果能够完成这项任务,我们将可以提供PLOS学科领域页面和外部数据源之间的链接,把匹配的外部数据定义引入PLOS词表。例如,为学科领域增加关联数据统一资源标识符,将使得PLOS词表融入当前的关联词表语义网之中。我们选取了DBpedia作为实验对象。一是因为DBpedia知识库是Linked Data的组成部分。DBpedia为数百万个内容创建了关联数据统一资源标识符,许多数据提供者已经开始从自己的数据集中建立指向DBpedia的RDF链接,DBpedia已经成为新兴数据网络(Web of Data)的核心Hub。其次,DBpedia基于维基百科页面持续更新,因此有保持更新、增加内容和提供入站链接的方式,所以,人们可以直接或间接地通过DBpedia链接到PLOS学科领域页面。

    发布时间: 2015-12-02

  • 14. 服务于科研的欧洲开放科学云
    王园
    作为欧盟委员会数字化统一市场战略的一部分,开放科学云(Open Science Cloud)将研究欧洲范围内的数据共享、数据责任和数据再利用,以利于创新和增长。本次联合声明体现了合作伙伴为切实实现欧盟愿景在开放科学云的组织机制、可持续发展以及治理方面的战略眼光。 开放科学作为主要驱动力推动科学的进步以及经济和社会的创新,欧洲科学开放云计划具有着重要的战略意义。为利用其全部价值获取公共和私人投资的成果,欧洲需要推动一个开放协同的平台实现研究数据的管理、分析、共享、保护和再利用,从而发展和传递创新服务。 为此,欧洲能够并且必须通过几十年公共投资建立连接国内外基础设施和服务的科学基础设施,包括实验设备、网络设施、高性能和高吞吐量计算、云计算服务、科学软件以及机构和团体的数据仓储。 欧洲开放科学云必须是: • 开放式的设计、参与和利用 • 以“共享方式”进行公共资助和管理 • 以研究为中心,研究人员和研究团体参与敏捷协同设计 • 广泛适用并且包容所有学科 • 多样化及分布式的授权网络效应 • 互操作的资源与服务通用标准 • 面向服务并以协议为中心 • 不同团体的社交连接 遵循这些原则将确保开放科学云是一项开放的、可信赖的、以服务为导向的开拓性事业、它涵盖所有利益相关者,为来自各领域的研究人员无缝地、开放地获取先进的数字化技术能力、资源和专业知识,以满足他们相互合作以及开展数据和计算密集型科学的需要。开放科学云将招募研究人员实现资源的治理、管理和保存,使其真正安全、可靠。通过共同治理,开放科学云将会改变二十年来在电子基础设施的公共和私人投资,为科学研究和创新带来收益。开放科学云是实现这一愿景的必要工具,以保证欧洲及其他地方实现科学卓越。

    发布时间: 2015-12-02

相关报告