gpt-2 · GitHub Topics

#大语言模型#RWKV (pronounced RwaKuv) is an RNN with great LLM performance, which can also be directly trained like a GPT transformer (parallelizable). We are at RWKV-7 "Goose". So it's combining the best of RNN a...

attention-mechanism 深度学习 gpt gpt-2 gpt-3 language-model linear-attention lstm PyTorch rnn transformer transformers rwkv ChatGPT

Python 13.5 k

6 天前

microsoft / LoRA

#计算机科学#Code for loralib, an implementation of "LoRA: Low-Rank Adaptation of Large Language Models"

gpt-2 adaptation language-model gpt-3 low-rank PyTorch 深度学习 roberta deberta lora

Python 11.73 k

4 个月前

codota / TabNine

AI Code Completions

翻译 - 全语言自动完成器：https：//tabnine.com/

人工智能 gpt-2 VS Code Extension sublime-package vim-plugin JavaScript TypeScript Rust C++Ruby Java Python Go Lua Bash Swift PHP Atom

Shell 10.75 k

9 个月前

NielsRogge / Transformers-Tutorials

This repository contains demos I made with the Transformers library by HuggingFace.

翻译 - 这个存储库包含我用 HuggingFace 的 Transformers 库制作的演示。

transformers PyTorch bert vision-transformer layoutlm gpt-2

Jupyter Notebook 10.56 k

3 个月前

EleutherAI / gpt-neo

An implementation of model parallel GPT-2 and GPT-3-style models using the mesh-tensorflow library.

翻译 - 使用Mesh-tensorflow库，可并行执行模型GPT2和类似GPT3的模型，并能够扩展到完整的GPT3尺寸（甚至可能更多！）。

language-model transformers gpt gpt-2 gpt-3

Python 8.29 k

3 年前

Morizeyao / GPT2-Chinese

#自然语言处理#Chinese version of GPT2 training code, using BERT tokenizer.

翻译 - 使用BERT标记程序的中文版GPT2培训代码。

transformer gpt-2 中文自然语言处理 text-generation

Python 7.56 k

1 年前

FoundationVision / VAR

[NeurIPS 2024 Best Paper][GPT beats diffusion🔥] [scaling laws in visual generation📈] Official impl. of "Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction". An *ultr...

auto-regressive-model diffusion-models image-generation transformers autoregressive-models generative-ai generative-model gpt gpt-2 large-language-models vision-transformer neurips

Jupyter Notebook 7.44 k

22 天前

lonePatient / awesome-pretrained-chinese-nlp-models

#自然语言处理#Awesome Pretrained Chinese NLP Models，高质量中文预训练模型&大模型&多模态模型&大语言模型集合

中文自然语言处理 pretrained-models bert roberta xlnet nezha ernie gpt gpt-2 dataset 大语言模型 large-language-models

Python 5.21 k

22 天前

jaymody / picoGPT

#自然语言处理#An unnecessarily tiny implementation of GPT-2 in NumPy.

深度学习 gpt gpt-2 large-language-models 机器学习神经网络 Python 自然语言处理

Python 3.34 k

2 年前

dbiir / UER-py

#自然语言处理#Open Source Pre-training Model Framework in PyTorch & Pre-trained Model Zoo

翻译 - PyTorch 中的开源预训练模型框架和预训练模型 Zoo

bert pre-training fine-tuning gpt 中文自然语言处理 PyTorch elmo classification ner t5 unilm roberta albert gpt-2 model-zoo bart xlm-roberta

Python 3.06 k

1 年前

yangjianxin1 / GPT2-chitchat

#自然语言处理#GPT2 for Chinese chitchat/用于中文闲聊的GPT2模型(实现了DialoGPT的MMI思想)

transformer gpt2 gpt-2 chichat 自然语言处理 text-generation dialogue-model dialogpt

Python 3.01 k

1 年前

guillaume-be / rust-bert

#自然语言处理#Rust native ready-to-use NLP pipelines and transformer-based models (BERT, DistilBERT, GPT2,...)

深度学习自然语言处理 transformer bert Rust 机器学习 ner sentiment-analysis question-answering language-generation gpt-2 roberta gpt bart electra translation

Rust 2.82 k

1 个月前

stochasticai / xTuring

#大语言模型#Build, customize and control you own LLMs. From data pre-processing to fine-tuning, xTuring provides an easy way to personalize open-source LLMs. Join our discord community: https://discord.gg/TgHXuSJ...

深度学习 fine-tuning gpt-2 gpt-j llama 大语言模型 lora language-model alpaca finetuning adapter gen-ai generative-ai mistral peft quantization

Python 2.64 k

7 个月前

BrikerMan / Kashgari

#自然语言处理#Kashgari is a production-level NLP Transfer learning framework built on top of tf.keras for text-labeling and text-classification, includes Word2Vec, BERT, and GPT2 Language Embedding.

翻译 - Kashgari是用于文本标签和文本分类的可立即投入生产的NLP Transfer学习框架，其中包括Word2Vec，BERT和GPT2语言嵌入。

自然语言处理 sequence-labeling text-classification bert-model ner 机器学习 nlp-framework named-entity-recognition gpt-2 transfer-learning seq2seq bert text-labeling

Python 2.39 k

7 个月前

asyml / texar

#自然语言处理#Toolkit for Machine Learning, Natural Language Processing, and Text Generation, in TensorFlow. This is part of the CASL project: http://casl-project.ai/