【中文版】Gemma技术报告-16页

下载本文档

阅读 478
下载 12
格式 pdf
大小 898.05 KB
约16页
2024-05-29
收藏
评论
点赞(0)
海报
举报

/16

MachineTranslatedbyGoogle2024‑02‑21Gemma：基于Gemini的开放模型研究与技术Gemma团队，谷歌DeepMind11完整的作者列表请参阅贡献和致谢部分。请将信件发送至gemma‑1‑report@google.com。这项工作介绍了Gemma，这是一个根据研究构建的轻量级、最先进的开放模型系列以及用于创建Gemini模型的技术。Gemma模型在各个方面都表现出强大的性能语言理解、推理和安全的学术基准。我们推出了两种尺寸的型号（20亿和70亿个参数），并提供预训练和微调的检查点。芽在18个基于文本的任务中，有11个的性能优于类似大小的开放模型，并且我们提出了全面的对模型的安全和责任方面的评估以及模型的详细描述发展。我们相信，负责任地释放法学硕士对于提高边境安全至关重要模型，并实现下一波法学硕士创新浪潮。介绍方法论。我们推出Gemma，一个开放模型系列Gemma提升最先进的性能基于Google的Gemini模型（GeminiTeam，2023）。相对于可比规模（和一些更大的），开放模型（Almazrouei等人，2023；Jiang我们使用类似的架构、数据、最多6T的文本标记来训练等，2023；Touvron等人，2023a,b)Gemma模型广泛的领域，包括自动化基准和人工评估。示例领域包括问答（Clark等人，以及双子座模范家庭的培训食谱。与Gemini一样，这些模型在文本领域实现了强大2019；Kwiatkowski等人，2019），常识的通才能力，同时还具备最先进的理解和推理能力。推理（Sakaguchi等人，2019；Suzgun等人，2022），数学和科学（Cobbe等人，规模。通过这项工作，我们发布了预训练的2021年；Hendrycks等人，2020）和编码（奥斯汀和微调的检查点，以及用于推理和服务的开源代码库。...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容