从词表到微调这就是你所需的一切
Google Bing GitHub
#自然语言处理#中文LLaMA-2 & Alpaca-2大模型二期项目 + 64K超长上下文模型 (Chinese LLaMA-2 & Alpaca-2 LLMs with 64K long context models)
alpaca2
Python script that converts datasets in the Alpaca-data format to the jsonl format needed to fine-tune the RedPajama-INCITE language model.