发布时间:2021-11-9 分类: 行业资讯
1969年,unix源代码在unix社区自由共享,人类历史上首次启动开源行动;
1991年,开源系统linux内核问世;
1998年,网景通信开放源代码,“开源”一词首次出现;
2005年,一个叫做git的scm工具出现了,一个托管的git代码仓库诞生了。
……
深深植根于互联网基因的开源,深刻改变了互联网的发展模式。
开源的历史是一部波澜壮阔的互联网发展史。
自达特茅斯会提出人工智能的概念以来,人工智能的发展经历了多次兴衰。随着技术的变革,互联网、大数据、云计算和5g的发展,人工智能在人类舞台上取得了长足的进步。
人工智能开启了人类的下一个时代。开源继续发挥着重要作用。机器学习和ai训练的数据开源平台层出不穷。开发者继续贡献人类智慧。开源、开放、自由、协作的精神推动了人工智能的不断发展。
政府、公益组织和个人共享数据,为全球人工智能输送“燃料”。越来越多的公司、大学、组织和个人加入了开源团队,kaggle、uci、openml、imagenet、openslr等平台开辟了大量的图像、文本和语音数据。数据已经成为人工智能领域开源精神的核心载体。
图:magichub数据开源社区正式发布
在这样的背景下,magichub.io数据开源社区(https://magichub.io)应运而生,并于4月15日正式发布。ai digital wisdom目前拥有全球领先的会话式ai语音数据集,通过自主研发的开源平台在行业内首次与第三方行业j9九游会官网的合作伙伴共享,可能会颠覆目前的容量瓶颈和用户的数据使用习惯。
国内外数十位开发者,如语音识别开源工具kaldi之父danielpovey,以及人工智能领域的大咖们,都在疯狂呼唤magichub.io数据开源社区。
大量结构化、多领域、多场景的数据集上传到magichub.io社区,社区多维度细分整理数据集帮助ai开发者快速找到适合自己模型的数据集,从而为开发者节省大量精力,将时间集中在模型开发和优化上。
magichub.io数据开源社区秉承“共享、共建、贡献创新、共同发展”的精神,部分数据由ai digital wisdom上传。同时,鼓励其他个人和团体在开源社区上传高质量和可靠的数据集。如果需要开源数据,请联系j9九游会官网。让我们把数据生产者和ai开发者联系在一起,互相保护,建立创新。
图:magichub开源社区j9九游会官网主页
目前,magichub.io数据开源社区已经首次开放了30种用于人工智能训练/测试的数据集,包括中文对话数据集、中文客服数据集、英语对话数据集和上海方言对话数据集。开源数据集涵盖nlp、asr、tts数据集和lex发音词典等。这些数据集按照语言、场景、应用领域等不同维度进行分类。
下一步,我们将继续在magichub.io社区开放高质量数据集,增加更多版块,让magichub.io社区持续贡献,创新共享形成合力,共同打造高质量人工智能数据开源社区。
开源是推动科技创新的主要源泉。开源社区的建立已经上升到国家层面,鼓励开源社区的发展,完善知识产权制度。《“十四五”规划和2035年远景目标纲要》提到,要“支持数字技术开源社区等创新联合体发展,完善开源知识产权和法律体系,鼓励企业开放软件源代码、硬件设计和应用服务。”
人工智能开启下一个开源时代,你我共同参与!
« 九州云极datacanvas完成c轮融资:定义标准化ai基础设施的未来 | 支付宝还允许你从公积金中提取资金,而且操作很快就能学会 »