拓尔思林松涛:发挥高质量数据积淀优势 打通大模型落地关键路径_天天热资讯
21世纪经济报道记者雷晨 北京报道
(资料图)
6月6日,由21世纪经济报道、北京人工智能产业联盟元宇宙专业委员会、中国文化产业协会文化元宇宙专业委员会主办的“21世纪卓越董事会人工智能闭门会”召开,主题为“AI领域上市公司创新涌现、技术难题与发展路径”。
会上,拓尔思(300229.SZ)副总裁林松涛介绍了“拓天”大模型及行业应用。他表示,大模型技术场景落地中的挑战,主要是质量、可控、时效和成本。
质量方面,他认为,个人服务用ChatGPT,提示词不准可以换一个,如果图片生成不好也可以再换一个,可以说个人对AIGC的容忍度是很高的。但是企业不一样,给政府写顾问报告,数据来源必须是准确的。
可控层面,一是内容安全,数据是有价值观的,模型没有价值观。二是私域数据安全,中国大模型要数据化落地,如何在保证用户私有数据安全的同时将大数据较好地运用也是一个问题。
时效方面,在大数据训练上,灾难性的遗忘一直都是训练的问题,所以需要大模型解决这个问题。另外,怎样输入即时数据,类似Chat GPT,数据最新只到2021年9月,因此在To B服务的时候用不好。
成本方面,千亿模型私有化落地的时候需要训练好,在企业端落地还需要让企业用得起。拓尔思做To B服务,垂直场景落地成为“百模大战”的核心要点。
据林松涛介绍,大模型出来以后颠覆了拓尔思此前积累的NLP技术,公司发现,在大模型的基础上再去结合知识图谱、自然语言处理技术效果更好。与此同时,公司拥有长期数据采集和高质量数据资产积累优势,可将数据迅速投入到大模型当中。
“现在拓尔思拥有全网数据1500亿,有人工整理、专家整理的数据库达30多个,主题数据110亿个,这是拓尔思能够做大模型很重要的优势。”林松涛称。
据了解,拓尔思在大模型应用方面首先选择政府、媒体和金融三个优势赛道。
在林松涛看来,做垂直领域首先要选好大模型基座,国内头部厂商自己做基座,也有一些厂商选择开源,同时还需要有数据以及在专业领域的积累,最后在大模型落地时,不仅要有技术、数据、还需要让用户知道如何应用,包括真实场景的闭环、基于用户反馈的学习等等。
“我们现在要解决的三个问题,一是实现大模型与专业知识库的融合。二是如何提升AIGC的内容质量和数据安全,特别是在内容事实核查方面。三是如何降低百亿级大模型落地的成本。”林松涛表示。
标签:
- 拓尔思林松涛:发挥高质量数据积淀优势 打通大模型落地关键路径_天天热资讯
- 苏州市相城区人大常委会党组成员、副主任李彩男接受纪律审查和监察调查
- 新疆持续优化营商环境 紧贴民生推动高质量发展|热讯
- 拨缴工会经费是什么意思_工会经费是什么意思
- 天天头条:杨丽萍担任艺术总监 朱凤伟、李祎然主演舞剧《三星堆纪》
- 【原】怎么培养睡神宝宝,拯救睡渣宝宝?这份干货,你值得拥有!
- 天天热点!江苏神通获2家机构调研:目前冶金行业的产品主要是运用在高炉煤气、转炉煤气的回收利用和煤气发电等领域(附调研问答)
- 谷歌和Nest路由器现在可以通过慢速的家庭互联网连接更好地工作-今日最新
- 兰州高新区首家乡村就业帮扶车间开业
- 环球即时:大晟文化06月07日主力资金大幅流出
- 视讯!洛川县147辆巡游出租车免费送考
- 东吴基金任命李素明为总经理兼财务负责人
- 天天快播:指鼠为鸭?江西省教育厅介入“食堂老鼠头”事件,网友爆料教职工要求控评,涉事窗口几乎没人去吃饭了……
- 快报:“爱沪长者?金融为民” 中信银行上海分行积极利用协同资源开展老年客户金融知识普及
- 环球视讯!罗博特科06月07日大涨,股价创历史新高
- 今日快讯:智也升级更名为生活 增加了更多新功能!
- 港交所:未来内地投资者或可经“港股通”买卖人民币柜台证券
- 全球热资讯!机构:房企融资规模仍在下降 海外债有新发
- 长周期看,只有成长性才是股市投资的精髓
- 数九天最冷是几九_数九天哪个九最冷
- 【期市盘面】甲醇跌超3%位居跌幅榜首!一品种主力资金流入近6亿
- 林忆宁ybb 林忆宁
- 环球速递!湖北潜江、恩施人事调动 涉两名副市长
- 比欧洲便宜20万 试驾北京奔驰“诚意之作”EQE SUV-今日热议
- 波音公司回应787飞机发现问题:影响近期交付_当前观察
- 暑运在即 呼和浩特机场日均航班量将大幅提升
- 科技助力奔跑的“三夏” 高效智慧节本增产
- 信濠光电:公司一直致力于与消费电子行业的主流品牌厂商保持密切合作
- 环球快报:成都大运会记者报名什么时候开始/截止?
- 天天速递!“鼠头罗生门”持续发酵:网友不买账校方通报,之前出过类似事件