51工具盒子

依楼听风雨
笑看云卷云舒,淡观潮起潮落

Gemma 2 2B介绍

2024.07.31 Google released Gemma 2 2B

  • https://developers.googleblog.com/en/smaller-safer-more-transparent-advancing-responsible-ai-with-gemma/

  • https://huggingface.co/collections/google/gemma-2-2b-release-66a20f3796a2ff2a7c76f98f

TL;DR:

  • 🤖 2B params, base model & finetune model

  • 🪟 8K context window

  • 🏆 Scores better than GPT-3.5, Phi-3 Small and Mixtral-8x7B-it on LMSYS

Smaller, Safer, More Transparent

  • 6月,Google发布的Gemma2模型包括9B,27B两个规模,当时没有开放2B规模的模型

  • 与前几天发布的llama3类似,本次Gemma 2除了新的2B模型,还发布了用于安全喝性能的 ShieldGemma & Gemma Scope

    • ShieldGemma是一套基于Gemma 2构建的安全内容分类器模型,用于过滤AI模型的输入和输出并确保用户安全。

    • Gemma Scope-一种新的模型可解释性工具,可提供对我们模型内部工作原理的无与伦比的洞察力。

Experience Next-Gen Performance, Now On-Device

  • 这种轻量级模型通过蒸馏从更大的模型中学习产生了更好的结果。

卓越的性能

在同尺寸开源模型中表现出一流的性能

灵活且经济高效的部署

Gemma 2可以在广泛的硬件上高效运行------从边缘设备和笔记本电脑到顶点人工智能和谷歌库伯内特斯引擎(GKE)的强大云部署。

为了进一步提高其速度,它通过NVIDIA TensorRT-LLM库进行了优化,并作为NVIDIA NIM提供。

这种优化针对各种部署,包括数据中心、云、本地工作站、个人电脑和边缘设备------使用NVIDIA RTX、NVIDIA GeForce RTXGPU或NVIDIA Jetson用于边缘人工智能的模块。

此外,Gemma 22B与Keras、JAX、拥抱脸、NVIDIA NeMo、Ollama、Garma. cpp以及即将推出的MediaPipe无缝集成,以实现简化开发。

开放和可访问

足够小,可以在谷歌Colab的T4图形处理器的免费层上运行,使实验和开发比以往任何时候都更容易。

ShieldGemma:使用最先进的安全分类器保护用户

ShieldGemma,旨在检测和减轻人工智能模型输入和输出中的有害内容。

ShieldGemma专门针对四个关键危害领域:

  • Hate speech 仇恨言论

  • Harassment 骚扰

  • Sexually explicit content 性显性内容

  • Dangerous content 危险内容

Gemma Scope:使用开放稀疏自动编码器阐明AI决策

Gemma Scope为研究人员和开发人员提供了前所未有的Gemma 2模型决策过程的透明度。Gemma Scope就像一台强大的显微镜,使用稀疏自动编码器(SAE)放大模型中的特定点,并使其内部工作更易于解释。

Demo

ollama run gemma2:2b

使用usloth量化后的版本加上MLX可以在iPhone 15pro 上流畅运行,预计安卓手机很快可以体验Apple的 device AI能力

Use MLX Finetune

  • https://gist.github.com/applecool/097d9f600177e83a5c1b93f3c826199b

赞(7)
未经允许不得转载:工具盒子 » Gemma 2 2B介绍