以中文信息处理为核心的基础资源库应用案例
发布网友
发布时间:2024-07-04 02:41
我来回答
共1个回答
热心网友
时间:2024-07-04 07:41
2009年,该系统内的数据库访问量显著,达到了约50,000人次,数据下载量更是突破了数十个吉字节的规模。这一年,对外共享的资源套数达到了69套,显示了其广泛的影响力。目前,中文信息基础资源库已吸引了超过100家会员单位的加入,共同参与到资源的利用和分享中。
在2008年北京奥运会的多语言服务系统开发中,该资源库发挥了关键作用。系统训练中,使用了面向奥运的中英日三语语料库,为多语言服务提供了强有力的数据支撑。
中国科学院自动化所的嵌入式语音合成系统也充分利用了其资源,包括CASIA汉语疑问句语料库、情感语料库、语音合成语料库等,以及ASCCD汉语普通话朗读和CADCC汉语普通话口语对话语料,这些中文信息资源对系统的训练起到了决定性的作用。
汉王科技公司和安徽科大讯飞公司作为长期的用户,他们的产品开发过程中频繁运用这些语料库,这证明了资源库在产品创新中的实用价值。
国际知名公司如IBM、Inter、飞利浦和松下电器等也加入了中文信息基础资源库的行列,共享这些宝贵的语料资源,推动了全球范围内对中文信息处理技术的发展和应用。
扩展资料[1]
以中文信息处理为核心的基础资源库应用案例
2009年,该系统内的数据库访问量显著,达到了约50,000人次,数据下载量更是突破了数十个吉字节的规模。这一年,对外共享的资源套数达到了69套,显示了其广泛的影响力。目前,中文信息基础资源库已吸引了超过100家会员单位的加入,共同参与到资源的利用和分享中。在2008年北京奥运会的多语言服务系统开发中...
材料测试数据库
材料测试数据库是我们公司精心构建的核心资源之一,它集成了丰富的材料测试数据,涵盖了从基础物理性能到高级化学特性的全方位信息。这一数据库不仅为研发人员提供了宝贵的数据支持,也助力了新材料开发和技术创新。我们持续更新数据库内容,确保数据的准确性和前沿性,以满足不同领域客户的多样化需求。矢量网络分析 (VNA) 是最重要的射频和微波测量方法之一。 创远信科提供广泛的多功能、高性能网络分析仪(最高40GHz)和标准多端口解决方案。创远信科的矢量网络分析仪非常适用于分析无源及有源器件,比如滤波器、放大器、混频器及多端口模块。 ...
以中文信息处理为核心的基础资源库只用方法
3. 技术文档:涵盖了资源名称、资源所有者、创建时间、建立目的等信息,还介绍了语料库的结构、技术参数以及执行的标准规范。4. 实例下载:为了方便用户了解和使用,平台提供资源规模约5%的样例数据供免费下载。对于更复杂或定制化的需求,用户可以选择通过电子邮件或电话联系数据服务团队,他们可以协助搜索、...
以中文信息处理为核心的基础资源库持续发展
中文信息处理的基础资源库致力于开放与共享,积极接纳全球范围内与该技术发展相关的数据资源和语料库。我们遵循开放的原则,不仅欢迎外部的贡献,还根据用户需求自主研发新的语料库,以满足多样化的研究需求。为了推广中文信息处理技术的研究成果,我们鼓励青年学者和热爱技术的人士创新设计算法和模型。为此,我们...
以中文信息处理为核心的基础资源库内容简介
中文信息处理基础资源库,作为全球最大的中文信息处理技术研发支持平台,由中国科学院计算技术研究所和自动化所共同管理。经过十多年的精心建设和积累,该库已在全球范围内搜集并开发了丰富的语料资源,总量接近500GB,涵盖了汉字处理、语音识别与合成、机器翻译、智能信息检索等多个核心领域。其中,不仅包含...
姚宏宇的工作经历
友友系统开发的CloudWare™云计算基础软件产品体系,就是这样的平台,以具备高效数据传输、交换和协同以及复杂事件处理能力的分布式数据总线Bitsflow®为核心,保证位于世界任意地点的任意两台或多台计算机之间可以进行安全、可靠、实时的海量信息交流,为构建计算云提供全方位的解决方案。中国中文信息学会理事长、中国工程院...
18款汉语教学经典资源库
汉语均衡语料库TH-ACorpus,网址:ctmlib.com/main,清华大学主办,提供对外汉语教材信息与功能支持,助力教材检索与共建。上海语言资源有声数据库展示系统,网址:yssj.shyywz.com/,国家语言文字工作委员会主办,汇集上海方言调查数据,展现语言多样性。江苏语言与文化资源库,网址:jsyy.jsjyt.edu.cn/,...
知网维普万方数据库的区别
一、知网、维普、万方数据库的区别 创立时间与定位 知网:由清华大学、清华同方发起,始建于1999年6月。它以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,采用自主开发并具有国际领先水平的数字图书馆技术,建设了《中国知识资源总库》及CNKI网格资源共享平台。维普网:创建于2000年,是...
中国中文信息学会的协会概况
基础理论专业委员会简介基础理论专业委员会主要研究以下两个领域,其一是中文信息处理技术的基础理论,其二是中文信息处理技术中尚未成熟的分支。 当前主要研究领域有: 1.汉字识别; 2.汉语语音识别与合成; 3.字频、词频统计; 4.汉语词语切分; 5.中文信息处理技术的规范化、标准化; 6.编码理论和评测标准; 7.字形...
常用的中文文献检索数据库有哪些
2. 万方数据库:由万方数据公司开发,这是一个涵盖期刊、会议纪要、论文、学术成果及学术会议论文的大型网络数据库。万方数据股份有限公司是国内第一家以信息服务为核心的股份制高新技术企业,在互联网领域提供综合信息服务。3. 中国年鉴网络出版总库:这是目前国内最大的连续更新的动态年鉴资源全文数据库,...
中文期刊数据库有哪些?
2. 万方数据库:万方数据公司开发的万方数据库是一个集期刊、会议纪要、论文、学术成果及学术会议论文于一体的综合性网络数据库。它与中国知网并称为中国两大专业学术数据库。万方数据股份有限公司作为国内首家以信息服务为核心的高新技术企业,在互联网领域提供信息资源产品、增值服务及信息处理方案。3. 中国年鉴网络出版...