#大语言模型# 有关Prompt Engineering (提示工程-人工智能)指南、论文、讲座等资源
#大语言模型# 面向所有人的对话式 AI,我们相信我们即将创造一场革命,正如 Stable Diffusion 改变了现代艺术的创作过程, 我们将透过对话式 AI 来改变世界.
#大语言模型# Unified Efficient Fine-Tuning of 100+ LLMs (ACL 2024)
#计算机科学# Code and documentation to train Stanford's Alpaca models, and generate the data.
#大语言模型# Universal LLM Deployment Engine with ML Compilation
#自然语言处理# Haystack 是一个开源 NLP 框架,利用预训练的 Transformer 模型。 帮组开发者能快速实现一个生产级的语义搜索、问答、摘要和文档排名的NLP应用
#自然语言处理# DocsGPT 是一个用于“文档”的基于GPT聊天助手,能快速检索项目文档,帮助开发人员轻松地提出与项目相关的问题,并获得准确的答案
#计算机科学# RWKV is an RNN with transformer-level LLM performance. It can be directly trained like a GPT (parallelizable). So it's combining the best of RNN and transformer - great performance, fast inference, sa...
#计算机科学# Code for loralib, an implementation of "LoRA: Low-Rank Adaptation of Large Language Models"
#计算机科学# An open source implementation of CLIP.
翻译 - CLIP 的开源实现。
#大语言模型# Build AI-powered applications with React, Svelte, Vue, and Solid
#自然语言处理# 大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP
#自然语言处理# 💥 Fast State-of-the-Art Tokenizers optimized for Research and Production
翻译 - optimized针对研究和生产进行了优化的快速最先进的分词器
#大语言模型# An Extensible Toolkit for Finetuning and Inference of Large Foundation Models. Large Models for All.
An implementation of model parallel GPT-2 and GPT-3-style models using the mesh-tensorflow library.
翻译 - 使用Mesh-tensorflow库,可并行执行模型GPT2和类似GPT3的模型,并能够扩展到完整的GPT3尺寸(甚至可能更多!)。
A framework for few-shot evaluation of language models.
An implementation of model parallel autoregressive transformers on GPUs, based on the Megatron and DeepSpeed libraries
翻译 - 基于DeepSpeed库的GPU上类似于GPT-3的模型并行模型的实现。设计为能够训练成千上亿个参数或更大参数的模型。