长沙晚报掌上长沙5月21日讯(全媒体记者 吴鑫矾 陈星源)“请依据‘两岸猿声啼不住,轻舟已过万重山’生成图片。”5月21日上午,在湖南汇视威根据国产算力预练习的视觉基座大模型“橘洲”V1端侧版别发布会现场,跟着一名现场嘉宾宣布指令,“橘洲”视觉基座大模型敏捷生成图片,只见屏幕上重峦叠嶂、流水潺潺,一叶扁舟在连绵不绝的万重山峦中轻捷行进。令人惊喜的是,作为国内首个根据国产算力预练习的视觉基座大模型,“橘洲”视觉基座大模型对诗词歌赋等中文的了解好像有先天优势,它生成的画面中,只“听”猿声而不见猿影,十分完美地展示了李白诗词的意境。
让大模型真实触手可及
“橘洲”视觉基座大模型由湖南汇视威智能科技有限公司(以下简称“汇视威”)自主研制,能在手机端完结1024×1024分辨率图画的秒级生成,具有本钱低、质量高、速度快、轻量级、可离线的特色。
汇视威创始人、董事长顾善植表明,“橘洲”视觉基座大模型的诞生,源于一个夸姣的愿景。
“咱们通过很多研制发现,现在大模型的使用都是根据云端算力进行练习、推理,不只会给企业带来昂扬的本钱,用户量也受到约束。”以当时的干流开源大模型为例,顾善植介绍,它们需求高端的显存,且想要生成高分辨率的图片,推理时刻往往较长,给云端算力带来不小的压力。
怎么让大模型真实普惠千行百业、千家万户,成为汇视威的中心攻关方向。
记者从会上了解到,“橘洲”视觉基座大模型在完结数据隐私安全的根底上,在智能手机上能做到秒级生成图片,完结低本钱移动端文生图,保证用户的个人创造不受时刻空间约束,手机开飞翔形式也能够“快速出图”。比照国外干流开源模型,生成相同质量图片的体积和时刻只需约1/20。
值得一提的是,依托中科曙光算力,“橘洲”视觉基座大模型在较短时刻便完结了近4000万张图片练习,成为全国首个在国产算力上完结全体练习和推理进程,并完结移动端布置的视觉基座大模型。
这一效果的背面,是汇视威团队的厚积薄发。据了解,汇视威自创业以来,一向专心于视觉算法的开发,已完结对才智园区、才智社区、才智工厂等十二大职业板块的布局,完结了数十项关键技能的打破。顾善植自己也表明,“前期千块显卡练习的经历,让我对大模型有了更深了解,也为端侧使用的研制奠定了根底。”
了解诗词歌赋“无压力”
发布会现场的屏幕上,一只红黑相间的知更鸟在碧绿的草地上悠然休息,饱满的羽翼与纤细的神态栩栩如生……这张知更鸟的图片,是“橘洲”视觉基座大模型测验成功的起点。顾善植介绍,它通过上百次试验才生成,代表着大模型的的技能道路总算打通,“关于团队来说含义特殊!”
通过多轮调试,“橘洲”视觉基座大模型现在交上了一份令人惊喜的的答卷。
“请为我生成一张图,‘一个山顶上的湖泊’。”接收到顾善植的指令后,“橘洲”视觉基座大模型当即开端举动,一张高清的图片在顷刻时间内逐渐明晰,这一进程彻底依靠手机自己的芯片完结,在场观众无不感到震慑。
记者注意到,在生成进程中,画面下方会实时显现生成进展。“相当于每一步,咱们都把这个图片进行了本地的复原。”顾善植解说,尽管看似有28步,但“橘洲”在10秒之内便能“解题”。
“上天入地,包罗万象”,面临一个个提示词,“橘洲”视觉基座大模型应对自若,无论是天上飞的仍是水里游的都难不倒它。作为一款国产大模型,它还颇有些我国人的“文艺范”,对诗词歌赋也有一套独特的了解。
比方,有嘉宾提出生成“中秋节故土的月亮”,它不只描绘了一轮明月,还以大红色的灯笼、碧瓦朱檐的宫廷作为衬托,蕴含着满满的东方意趣。
再比方,面临李白的“两岸猿声啼不住,轻舟已过万重山”一句,一幅山水景致跃然屏幕之上。重峦叠嶂间流水潺潺,一叶扁舟顺流而下,并且奇妙的是,画面中只“听”猿声而不见猿影,部分大模型“会错意”的状况在这里不曾呈现。
未来将兼容更多国产生态
“橘洲”视觉基座大模型的发布,不只标志着我国在视觉大模型范畴完结从“云端依靠”到“端侧自主”的跨过,更以“轻量化、高精度、强隐私”的技能打破,让文生图片与千行百业的链接成为可能。
“移动端怎么平衡算力与功能,并完结多设备适配?”“企业未来怎么继续立异,坚持领先地位?”“国产生态怎么提高兼容性?”……现场,专家学者对“橘洲”视觉基座大模型的未来打开发问,并进行了深度讨论。
“咱们未来计划联合硬件厂商开发定制化计划,完结更精准的端侧适配。”顾善植说,“立异永无止境。本次发布的V1版别仅仅一个开端。在打通‘0—1’的闭环之后,还有练习途径优化、生成速度提高、与职业使用相结合等许多立异点等候霸占。”
一起,顾善植也泄漏迭代蓝图:坚持每半月一次的版别更新节奏,估计6月、7月都会有新版别问世,也会兼容更多的手机版别,与国产操作系统进行绑定、结合。
作为湖南省100个标志性数字新基建项目,“橘洲”视觉基座大模型的落地仅仅起点。顾善植表明,未来汇视威将逐渐拓宽至文生视频、视频了解等范畴,构建“端云协同”的智能生态。在隐私核算与边际核算深度交融的当下,“橘洲”视觉基座大模型或将重塑全球AI工业格式,为“数字我国”建造供给关键技能支点。