Llama 31中文微调数据集已上线超大模型一键部署

产品展示 /PRODUCTS

Llama 31中文微调数据集已上线超大模型一键部署

2024-10-15 09:28:57

浏览次数：次

返回列表

　　hyper.ai 官网在教程板块为大家提供了使用「Open WebUI」和使用「OpenAI 兼容 API 服务」两种方式启动这两个超大模型的教程！此外，还上线了中文微调数据集 DPO-zh-en-emoji，下拉文章获取链接~

　　别担心！hyper.ai 官网在教程板块为大家提供了使用「Open WebUI」和使用「OpenAI 兼容 API 服务」两种方式启动这两个超大模型的教程！此外，还上线了中文微调数据集 DPO-zh-en-emoji，下拉文章获取链接~

　　该数据集是一个专为微调大语言模型而设计的数据集，包含了大量的问答对数据，每个问题都有中文和英文两个版本的答案，并且答案中融入了趣味幽默的元素，包括表情符号 (emoji) 的使用。shareAI 团队已将其用于微调 Llama 3.1 8B 模型。

　　UrbanSARFloods 是专门用于城市和开放区域洪水制图的数据集，包含 8,879 个 512×512 的图像块，覆盖 807,500 平方公里，涵盖了 18 次洪水事件。解决了现有的大规模 SAR 衍生洪水制图研究中对城市洪水关注不足的问题。

　　该数据集是一个为遥感图像理解设计的多用途视觉-语言基准数据集，包含 29,614 张经过人工验证的详细字幕图像、52,472 个对象引用和 123,221 个问答对，旨在推进通用的、大规模的遥感图像视觉-语言模型的发展。

　　MIND 包含约 16 万篇英文新闻文章和 100 万用户生成的超过 1500 万条印象日志，收集自 Microsoft News 网站的匿名行为日志。旨在作为新闻推荐的基准数据集，并促进新闻推荐和推荐系统领域的研究。

　　BoWFire 数据集是一个专门用于火焰检测的图像数据集，旨在提高火灾检测的准确性并减少误报。该数据集包括了多种紧急情况下的火灾图像，例如建筑物着火、工业火灾、车祸和骚乱等情况。

　　江南体育平台

　　该数据集包含 CNN 和 Daily Mail 记者撰写的 30 多万篇新闻文章，旨在帮助开发能够用一两句话概括长段落文本的模型。

　　该数据集包含 100 多万张图像，涵盖 340 个涂鸦类别，经过处理后可用于机器学习任务。

　　Yoga-16 数据集旨在提高瑜伽姿势识别模型的分类准确率。它分为三个主要目录：训练、测试和验证，每个目录包含 16 个子目录，对应 16 种不同的瑜伽姿势。

　　该数据集包含男性和女性两个人物类别图像文件夹。图像包括面部、上半身和全身。可用于性别识别、人类身份识别和图像分类等各种项目。

　　1. 学术分享丨清华大学博士后李雨哲详解 Cell/Nature 子刊论文，探索基因组学的 AI 应用

　　「Meet AI4S」系列直播第二期，邀请到了清华大学张强锋实验室博士后李雨哲。8 月 21 日，李雨哲博士将以线上直播的形式进一步为大家分享空间转录组学和单细胞组学研究中的 AI 方法。

　　2. 全球首个！清华/上海交大等联合构建面向糖尿病诊疗的视觉-大语言模型，登 Nature 子刊

　　3. 首次！GPT-2赋能无线通信物理层，北大团队提出基于预训练LLM的信道预测方案

　　清华大学副教务长、医学院主任黄天荫教授团队，上海交通大学电院计算机系/教育部人工智能重点实验室盛斌教授团队，上海交通大学医学院附属第六人民医院贾伟平教授及李华婷教授团队，新加坡国立大学及新加坡国家眼科中心覃宇宗教授团队通力合作，成功构建全球首个面向糖尿病诊疗的视觉-大语言模型集成系统 DeepDR-LLM 。本文是该研究的详细解读和分享。

　　以上就是本周编辑精选的全部内容，如果你有想要收录 hyper.ai 官方网站的资源，也欢迎留言或投稿告诉我们哦！

　　HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区，致力于成为国内数据科学领域的基础设施，为国内开发者提供丰富、优质的公共资源，截至目前已经：

上一篇：江南体育平台组图：只有夫妻才能做的瑜伽动作

下一篇：8个瑜伽球动作深度灵活脊柱一定要多练

江南体育官网

关于江南体育

新闻中心

产品展示

留言板

瑜伽常识

联系江南体育

产品展示 /PRODUCTS

Llama 31中文微调数据集已上线超大模型一键部署

友情链接：

联系我们