通古大模型:一款具备强大的古籍理解和处理能力的古籍大语言模型

通古大模型是由华南理工大学团队基于古籍领域长期积累的丰富大数据资源,通过自动生成的对话模板和大模型指令微调技术训练而成的数字人文模型。

通古大模型

通古大模型功能特点包括:

1、古籍理解和处理能力

– 通古大模型具备强大的古籍理解和处理能力,能够智能实现文白翻译、句读标点和古籍检索等功能。

2、多阶段指令微调

– 模型采用了多阶段指令微调技术,结合冗余度感知微调(RAT)方法,显著提升了下游任务性能,同时保留了基座模型的能力。

3、丰富的古籍数据资源

– 通古大模型基于2.41B古籍语料进行无监督增量预训练,并在400万古籍对话数据上进行指令微调。

4、高效迁移学习

– 通过渐进式微调,通古大模型能够在有限的数据下实现多个任务的高效迁移学习和专业化,从而提高全面的古籍处理任务熟练程度。

5、自然对话形式

– 模型以自然对话的形式融合多种任务,使得用户能够以更亲切自然的方式了解中国传统文化。

6、古籍文档分析与识别系统

– 通古大模型还配套开发了古籍文档分析与识别系统,能够自动定位并识别古籍图片中的文本,添加标点符号并翻译为白话文。

通古大模型应用场景:

1、古籍研究与教学:帮助研究人员和学生更高效地理解和翻译古籍文献。

2、文化传承与传播:通过自然对话形式,让大众更便捷地了解中华传统文化。

3、古籍数字化:为古籍文物数据挖掘、知识发现和智能化开发提供技术支撑。

通古大模型项目地址:

1、Github仓库https://github.com/SCUT-DLVCLab/TongGu-LLM

2、HuggingFace模型库https://huggingface.co/SCUT-DLVCLab/TongGu-7B-Instruct