《科创板日报》12月11日讯(记者 黄心怡)在阿里今年三季度的财报电话会上,夸克作为第一批战略级创新业务——1688、闲鱼、钉钉、夸克,位居“阿里四小龙”之列。这是阿里巴巴多年以来的财报中首次提及夸克这一业务。
《科创板日报》记者了解到,夸克业务始于2018年,目前隶属于阿里巴巴智能信息事业群。今年11月中旬,千亿级参数的夸克大模型正式发布,并于在12月官宣通过备案,将陆续在通识、健康、创作等领域升级内容产品与工具,并落地一系列AIGC应用。
近日,夸克技术负责人蒋冠军接受了《科创板日报》记者的采访。他表示,在健康、教育行业和通用搜索上,夸克已有对应产品准备上线。
谈及国内大模型和GPT之间的能力水平差距,蒋冠军表示了较强的信心。“国内大模型的整体能力水平肯定比GPT-3.5好,这是确定的。而在健康领域上,我们的大模型效果远远好于Open AI,也好于国内其他厂商。”
▍健康、教育领域将是战略重点
作为一个单独的APP,夸克内含搜索、网盘、扫描、学习、文档、小说等业务。其中,搜索是夸克的核心业务。蒋冠军告诉《科创板日报》记者,夸克用户中,50%以上都是25岁以下年轻用户。
随着大模型和AIGC浪潮的到来,搜索引擎成为大模型技术落地应用的战略要地。对于大模型如何对夸克的升级, 蒋冠军称,在搜索方面,我们已经准备上线一些具体的产品。
“搜索是以内容为核心驱动的产品。我们在搜索上推出了大量的AIGC内容,并在搜索的后链路,正筹划新的智能技术产品创新和改造。”
在云盘方面,借助大模型加持的多模态技术和能力下,夸克网盘相册可用自然语言完成检索,并将升级扫描、资料生成等相关工具。
值得一提的是,健康、教育两大垂直行业成为夸克的重点建设方向。
“健康领域是搜索引擎核心的群体,因为没有其他APP或软件能给用户提供很好的信息服务。所以,相关用户也是夸克的重点用户群体。我们做了很多健康行业数据建设和知识建设,有完整的知识图谱。而且建设了大量的医典百科、医典问答的面向C端用户的数据,整理了大量的指南、标准、书籍等一系列数据。”蒋冠军说。
同时,夸克也在开展教育全行业数据建设,包括各种方案资料、教案、题库、知识点、教研知识等。
具体的产品应用方面,夸克在健康领域将专注于信息服务,解决用户对健康知识的获取、查询问题,提升知识获取的准率、效率和交互方式。“近期我们会发布一些对应的产品,这个领域有非常好的机会,市场也足够大。”
蒋冠军认为,在教育领域, 大模型的应用还有关键问题有待解决。“首先,大模型整体的推理和梳理能力的水平还没那么好,这对于教育行业的整体教研体系和知识体系构建,以及教育产品的升级,是非常重要的。其次,大模型的图形多模能力,在教育上是理解不了的。”
为此,夸克优先关注的是教育优质内容的生产。“我们围绕着搜索里面和夸克用户里的具体教育需求,先做大量的AIGC内容,包括文档、题、历史、英语等,这有点像初级家教了。围绕生产的内容,针对用户具体场景,做对话和交互的产品创新。”
▍大模型规模化应用的时代尚未到来
今年以来,国内掀起的“百模大战”十分火热,但在应用落地上面临仍面临诸多挑战。
在蒋冠军看来,要解决大模型应用的问题,首先需解决知识正确性。“现在,国外围绕大模型的创新产品,主要靠大模型的创意能力。比如说,生成文案、数字人的对话,或图像生成,这些产品有自己的市场。但更好用的大模型产品和创新产品,应该把知识和创意结合起来,这才是更大的空间。目前,拥有一定规模和生命力的大模型产品和应用的时代或阶段,还没有到来。”
此外,居高不下的算力成本一直是大模型应用的瓶颈。“大模型提供服务遇到的最大难点就是在线推理太贵,我相信,这是之后半年到一年各大公司都要重点解决的问题。”
对于大模型的未来发展,蒋冠军主要看好以下应用领域。
第一,创新创意领域。“国外已经有估值比较高的公司。而在国内很多广告文案都是大模型生成的,做这方面工作的文案公司也很多。”
第二,涉及重复劳动的领域。“像资料收集和重复整理编辑等等,辅助人来提效。”
第三、健康、教育等具体的垂直场景。“垂直模型将比通用模型先发展。因为通用模型遇到的问题非常多,存在各种各样的幻觉问题、安全问题等。但是进入到垂直模型,这些问题可以解决,因为大模型可以拒绝回答。”
谈及大模型对搜索引擎的颠覆,蒋冠军认为,理论上,只要大模型足够强,未来都不需要搜索引擎,但显然当下大模型的技术能力,还没到这样的程度。所以现阶段,大模型一定会和搜索引擎共存。
“后续,搜索功能将慢慢被大模型的功能替代,或者大模型的基础能力越来越往搜索里渗透。先是大模型辅助搜索,完成一些工作,慢慢变成以大模型为核心,用搜索帮它完成产品创新。”