人工智能技术加持,新一代通用视觉技术体系“

 头条123   2025-01-12 08:37   1831 人阅读  0 条评论
人工智能技术加持,新一代通用视觉技术体系“ 昨日,上海野生智能尝试室结合商汤科技 SenseTime、喷鼻港中文年夜学、上海交通年夜学配合公布新一代通用视觉手艺系统“墨客”(INTERN),该系统旨正在体系化处理当下野生智能视觉范畴中存正在的使命通用、场景泛化和数据效力等一系列瓶颈题目。

▲ 图源:上海野生智能尝试室

今朝,手艺陈述《INTERN: A New Learning Paradigm Towards General Vision》已正在 arXiv 平台公布,基于“墨客”的通用视觉开源平台 OpenGVLab 也将正在来岁年头正式开源,向学术界和财产界公然预练习模子及其利用范式、数据体系和评测基准等。

按照相干手艺陈述,一个“墨客”基模子便可周全笼盖分类、方针检测、语义朋分、深度估量四年夜视觉焦点使命。

上海野生智能尝试室暗示,相较于当前 强开源模子(OpenAI 于 2021 年公布的 CLIP),“墨客”正在精确率和数据利用效力上均获得年夜幅晋升。详细而言,基于一样的下流场景数据,“墨客”正在分类、方针检测、语义朋分及深度估量四年夜使命 26 个数据集上的均匀毛病率别离下降了 40.2%、47.3%、34.8% 和 9.4%。

通用视觉手艺系统“墨客”(INTERN)由七年夜模块构成,包罗通用视觉数据体系、通用视觉收集布局、通用视觉评测基准三个根本举措措施模块,和辨别高低游的四个练习阶段模块。

本文地址:https://www.toutiao123.net/news/30762.html
版权声明:本文为原创文章,版权归 头条123 所有,欢迎 本文,转载请保留出处!