CNTXJ.NET | 通信界-中国通信门户 | 通信圈 | 通信家 | 下载吧 | 说吧 | 人物 | 前瞻 | 智慧(区块链 | AI
 国际新闻 | 国内新闻 | 运营动态 | 市场动态 | 信息安全 | 通信电源 | 网络融合 | 通信测试 | 通信终端 | 通信政策
 专网通信 | 交换技术 | 视频通信 | 接入技术 | 无线通信 | 通信线缆 | 互联网络 | 数据通信 | 通信视界 | 通信前沿
 智能电网 | 虚拟现实 | 人工智能 | 自动化 | 光通信 | IT | 6G | 烽火 | FTTH | IPTV | NGN | 知本院 | 通信会展
您现在的位置: 通信界 >> 国内新闻 >> 新闻正文
 
合合信息IPO进行时:破解中文语料难题,加速大模型性能飞跃
[ 通信界 | 静姝 | www.cntxj.net | 2024/9/22 22:09:30 ]
 

近日,在2024年世界人工智能大会(WAIC)上,合合信息推出TextIn智能文档处理平台,这一创新举措不仅旨在解决当前大模型训练面临的数据局限与质量问题,特别是针对中文语料稀缺和复杂文档解析的难题,更为合合信息的IPO之路增添了浓墨重彩的一笔,为其在AI行业发展提供了强有力的“加速器”。

随着人工智能技术的飞速发展,大模型展现出前所未有的强大能力,其性能的提升离不开海量高质量数据的支持。然而,在中文领域,高质量数据资源的匮乏成为了制约大数据性能进一步提升的瓶颈。合合信息此次推出的Textin智能文档处理平台,针对这一痛点为行业带来了前所未有的解决方案,同时也为公司未来的IPO市场表现奠定了坚实的基础。

该平台集成了TextIn文档解析、TextIn Embedding(文本向量数据模型)以及OpenKIE三大核心工具,旨在从源头提升语料质量,加速大模型的训练与迭代。使用后的大模型具备了更快速、优秀的文档要素分析、表格内容识别能力。其中,TextIn文档解析引擎以其卓越的性能和广泛的适用性,在复杂文档解析方面展现出了强大实力,为大模型提供了更加纯净、结构化的训练数据。

除了文档解析,TextIn Embedding模型也是该平台的重要组成部分。该模型通过深入学习大量中文语料,能够迅速定位目标信息,提取有效文本特征,提高大模型在信息搜索和问答方面的质量、效率和准确性。相比其他开源模型,TextIn Embedding模型具有体积小、占用资源少、支持可变输出维度等优势,能够更好地适应不同场景的需求。

此外,OpenKIE信息抽取工具也为TextIn智能文档处理平台增色不少。该工具能够自动抽取文档中的关键信息,并直接应用于其他系统,极大地提高了工作效率。在大模型文档处理场景中,合合信息与百川智能等头部企业合作,共同破解了多文档元素识别、版面分析等难题,将百页文档的整体处理速率提升超过10倍。

合合信息智能创新事业部总经理唐琪表示,TextIn智能文档处理平台目前已覆盖金融、医学、财经、媒体等47个场景,共支持3200余类文档的处理。该平台已被多家头部大模型厂商纳入预训练流程,并积累了小批量开发者用户。。

未来,合合信息将继续深耕文档处理领域,为大模型的训练与应用提供更多优质“燃料”,推动人工智能技术的持续进步。同时,随着公司IPO进程的推进,合合信息将进一步加速其在AI领域的布局和发展,为社会创造更大的价值。

 

1作者:静姝 来源:中国财经报道 编辑:顾北

 

声明:①凡本网注明“来源:通信界”的内容,版权均属于通信界,未经允许禁止转载、摘编,违者必究。经授权可转载,须保持转载文章、图像、音视频的完整性,并完整标注作者信息并注明“来源:通信界”。②凡本网注明“来源:XXX(非通信界)”的内容,均转载自其它媒体,转载目的在于传递更多行业信息,仅代表作者本人观点,与本网无关。本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。③如因内容涉及版权和其它问题,请自发布之日起30日内与本网联系,我们将在第一时间删除内容。 
热点动态
普通新闻 合合信息IPO进行时:破解中文语料难题,加速大模型性能飞跃
普通新闻 强强联合!亚信科技、阿里云携联盟之力,助力行业“零门槛”玩转大
普通新闻 黎巴嫩通信设备爆炸,国产对讲机企业将充分受益?
普通新闻 播种原创思维,戴森推动校企合作共筑创新生态
普通新闻 山东济宁华为擎云商用终端专区 为区域政企发展注入新动力
普通新闻 亚信科技与海南自贸港产业园签署合作协议,海南有关部门调研亚信科
普通新闻 高通钱堃:5G和AI交替推动,带来新一轮创新周期
普通新闻 聚焦制造业企业货量旺季“急难愁盼”,跨越速运打出纾困“连招”
普通新闻 我国将推进移动物联网向“万物智联”发展
普通新闻 我国“5G+工业互联网”项目超1.4万个最新成果→
普通新闻 2024年服贸会:科技感十足“潮”有料
普通新闻 算力中国行|“土壤”好 “气候”好 “种子”好 河南算力异军突起的
普通新闻 金砖新联接 智创新未来 2024金砖新联接创新论坛在福建厦门举行
普通新闻 加快移动物联网发展!力争到2027年移动物联网终端连接数突破36亿
普通新闻 从智博会看数字经济新动向
普通新闻 62款App完成个人信息收集使用合规整改,京东、淘宝等在列
普通新闻 《人工智能安全治理框架》1.0版发布
普通新闻 工信部印发《关于推进移动物联网“万物智联”发展的通知》
普通新闻 国家网络安全宣传周|应对新挑战 打造新安全
普通新闻 TCL实业荣获IFA2024多项大奖,展示全球科技创新力量
通信视界
我国科学家研制出世界首款类脑互补视觉芯片“
普通对话 我国科学家研制出世界首款类脑互补视觉芯片
普通对话 李彦宏:不断地重复开发基础大模型是对社会
普通对话 中兴通讯徐子阳:强基慧智,共建数智热带雨
普通对话 邬贺铨:移动通信开启5G-A新周期,云网融合
普通对话 华为轮值董事长胡厚崑:我们正努力将5G-A带
普通对话 高通中国区董事长孟樸:5G与AI结合,助力提
普通对话 雷军发布小米年度演讲:坚持做高端,拥抱大
普通对话 张志成:继续加强海外知识产权保护工作 为助
普通对话 吴春波:华为如何突破美国6次打压的逆境?
普通对话 刘烈宏:以数字化网络化智能化助力数字经济
通信前瞻
我国国产首颗全电推通信卫星亚太6E卫星成功投
普通对话 “百模大战”中,工业大模型如何闯出“新天
普通对话 经济聚焦·访智能制造 解行业痛点
普通对话 60秒解锁“北斗+”“+北斗”
普通对话 需求激增 算力基础设施加快落地
普通对话 我国国产首颗全电推通信卫星亚太6E卫星成功
普通对话 SpaceX离第四次发射星际飞船又近一步
普通对话 哈勃望远镜步入暮年,陀螺仪仅剩2个,NASA打
普通对话 顶层设计完善 智慧城市建设开足马力
普通对话 中央企业智能算力规模加速增长
普通对话 工信部规划1亿个专用号用于车联网发展,将如
普通对话 邬贺铨院士解读ChatGPT等数字技术热点
普通对话 华为云Stack智能进化,三大举措赋能政企深度
普通对话 物联网设备在智能工作场所技术中的作用
普通对话 软银研发出以无人机探测灾害被埋者手机信号
普通对话 AI材料可自我学习并形成“肌肉记忆”
推荐阅读
Copyright @ Cntxj.Net All Right Reserved 通信界 版权所有
未经书面许可,禁止转载、摘编、复制、镜像