阡陌居

 找回密码
 立即注册
搜索
热搜: 新人报到
查看: 6|回复: 0

[论文] 《基于视觉语言模型的平面几何图形自动形式化》作者:崔晓腾,刘一【PDF】

[复制链接]

用户组:分区版主

我,秦始皇,打钱

爱心会员勋章重建论坛爱心会员勋章重建论坛勋章版主勋章分区版主勋章

      UID
51
      积分
21110
      回帖
1377
      主题
2163
      发书数
757
      威望
16183
      铜币
85195
      贡献
2400
      阅读权限
100
      注册时间
2025-2-27
      在线时间
3892 小时
      最后登录
2025-12-17
发表于 2025-6-18 02:57 | 显示全部楼层 |阅读模式
基于视觉语言模型的平面几何图形自动形式化
崔晓腾,刘一
北京交通大学计算机科学与技术学院,北京市 100044
摘要:视觉语言模型等大模型已展现出强大的世界知识理解能力,为数学问题自动求解研究提供了新的启发。在几何问题自动求解领域,几何图形中所蕴含的复杂多样的抽象几何关系给利用大模型进行求解带来了巨大挑战。为了提升几何问题求解的准确性,本文分析了现有的求解范式,并提出利用视觉语言模型来提高几何图形自动形式化的准确性。首先,通过利用代数交换律进行数据增强,本文基于数据集 Geometry3K构建了一个多模态指令微调数据集GeometryDiagramFormalization86K (GDF86K)。该数据集包含超过86,000个(几何图形,形式化语言文字列表)数据对,以促进图形形式化模型的训练。基于 GDF86K 进行有监督微调,本文训练得到专注于几何图形形式化的视觉语言模型 Geo-TinyLLaVA。在输入的几何图形带有完整的几何点命名标注的前提下,Geo-TinyLLaVA 在几何图形形式化任务上的表现优于传统的 Inter-GPS 图形解析器,并可作为插件集成到 Inter-GPS几何问题求解系统中,以提高其求解准确率。
关键词:视觉语言模型;形式化;平面几何;教据增强;有监督微调
中图分类号:TP183



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 1威望 +1 铜币 +2 收起 理由
飞乌与渔 + 1 + 2 论坛有您更精彩!

查看全部评分

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|阡陌居

GMT+8, 2025-12-17 01:40 , Processed in 0.141251 second(s), 32 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表