发布日期:2026-03-30 07:52 点击次数:171
IT之家 3 月 26 日音问,科技媒体 9to5Mac 昨日(3 月 25 日)发布博文,报说念称苹果公司联袂威斯康星大学麦迪逊分校,和谐发布名为 RubiCap 的全新 AI 老到框架,主要用于优化“密集图像模式”模子的老到历程。
IT之家注:密集图像模式(Dense Image Captioning)是一种先进的计算机视觉时刻。与只给出一句举座模式不同,该时刻能识别图片中的各个局部区域(如“桌子上的红苹果”、“远方的行东说念主”),并为每个细节生成精确的笔墨证据。
这项时刻在老到视觉言语模子、文本生成图像以及改善无卤莽用具等领域具有中枢价值。究诘东说念主员指出,传统的老到措施濒临着东说念主工标注资本过高的问题;而诈欺现存大模子生成合成数据的替代有商量,则容易导致模子输出短少各类性且泛化才气较弱。
苹果究诘团队为了攻克上述清贫,立异假想全新强化学习机制。系统率先从数据勾通抽取 5 万张图像,并调用 GPT-5、Gemini 2.5 Pro 等前沿大模子生成候选模式。
随后,系统诈欺 Gemini 2.5 Pro 分析候选实质,索求共鸣与遗漏点,进而将其滚动为明晰的评分尺度。临了,由 Qwen2.5 模子担任“裁判”,把柄这些尺度对模式进行打分。这种机制为模子提供了结构化的精确响应,让其明确知说念该若何修正异常。
苹果基于这一框架,最终老到出了参数目折柳为 20 亿、30 亿和 70 亿的三个 RubiCap 模子。测试数据线路,这些紧凑型模子展现出了惊东说念主的效果,其中 70 亿参数模子在盲测中取得了最高的排行,并完了了最低的“幻觉”异常率,全面稀奇了参数目高达 720 亿的前沿大模子。
更值得一提的是,30 亿参数的袖珍模子在部分测试中以至反超了 70 亿参数版块,进而充分评释,高质地的图像模式模子不错开脱对开阔参数目的全王人依赖。
IT之家附上参考地址九游体育娱乐网
上一篇:九游体育app官网说了一句:“抬我立地-九游「中国」Ninegame·官方网站-登录入口
下一篇:没有了