foundation-models · GitHub Topics

#计算机科学#一个整合高效并行技术的AI大模型训练系统。

深度学习 hpc large-scale data-parallelism pipeline-parallelism model-parallelism 人工智能 big-model distributed-computing inference heterogeneous-training foundation-models

Python 40.77 k

3 天前

haotian-liu / LLaVA

#大语言模型#LLaVA是一个具有 GPT-4V 级别功能的大语言和视觉模型助手

gpt-4 聊天机器人 ChatGPT llama multimodal llava foundation-models instruction-tuning multi-modality visual-language-learning llama-2 llama2 vision-language-model

Python 22.17 k

8 个月前

microsoft / unilm

#自然语言处理#Unilm是一个跨任务、语言和模式的大规模自监督预训练模型

自然语言处理 pre-trained-model unilm minilm layoutlm layoutxlm beit document-ai trocr beit-3 foundation-models 大语言模型 multimodal mllm

Python 21.05 k

1 个月前

deepseek-ai / Janus

#大语言模型#Janus-Series: Unified Multimodal Understanding and Generation Models

any-to-any foundation-models 大语言模型 multimodal vision-language-pretraining unified-model

Python 17.09 k

2 个月前

multimodal-art-projection / YuE

#计算机科学#YuE: Open Full-song Music Generation Foundation Model, something similar to Suno.ai but open

foundation-models music-generation huggingface llama audio-generation 声音克隆 llms 人工智能深度学习 gpt

Python 4.77 k

6 天前

deepseek-ai / DeepSeek-VL

DeepSeek-VL: Towards Real-World Vision-Language Understanding

vision-language-model vision-language-pretraining foundation-models

Python 3.77 k

1 年前

NExT-GPT / NExT-GPT

#大语言模型#Code and models for ICML 2024 paper, NExT-GPT: Any-to-Any Multimodal Large Language Model

ChatGPT foundation-models gpt-4 instruction-tuning large-language-models 大语言模型 multi-modal-chatgpt multimodal visual-language-learning mllm

Python 3.48 k

5 个月前

PriorLabs / TabPFN

#计算机科学#⚡ TabPFN: Foundation Model for Tabular Data ⚡

数据科学 foundation-models 机器学习 tabpfn tabular-data

Python 3.25 k

15 小时前

EvolvingLMMs-Lab / Otter

#大语言模型#🦦 Otter, a multi-modal model based on OpenFlamingo (open-sourced version of DeepMind's Flamingo), trained on MIMIC-IT and showcasing improved instruction-following and in-context learning ability.

gpt-4 visual-language-learning artificial-inteligence 深度学习 foundation-models multi-modality 机器学习 ChatGPT instruction-tuning large-scale-models embodied-ai

Python 3.25 k

1 年前

OpenGVLab / Ask-Anything

#大语言模型#[CVPR2024 Highlight][VideoChatGPT] ChatGPT with video understanding! And many more supported LMs such as miniGPT4, StableLM, and MOSS.

captioning-videos ChatGPT gradio langchain video-question-answering video-understanding stablelm chat Video big-model foundation-models large-language-models

Python 3.21 k

3 个月前

amazon-science / chronos-forecasting

#大语言模型#Chronos: Pretrained Models for Probabilistic Time Series Forecasting

forecasting large-language-models 大语言模型机器学习 time-series foundation-models pretrained-models time-series-forecasting timeseries 人工智能 huggingface huggingface-transformers transformers

Python 3.15 k

2 天前

CLUEbenchmark / SuperCLUE

#大语言模型#SuperCLUE: 中文通用大模型综合性基准 | A Benchmark for Foundation Models in Chinese

ChatGPT 中文 evaluation foundation-models gpt-4

3.15 k

1 年前

baaivision / EVA

EVA Series: Visual Representation Fantasies from BAAI

foundation-models representation-learning vision-transformer

Python 2.47 k

8 个月前

autodistill / autodistill

#计算机科学#Images to inference with no labeling (use foundation models to train supervised models).

机器视觉 auto-labeling 深度学习 foundation-models grounding-dino image-annotation image-classification instance-segmentation labeling-tool 机器学习 multimodal object-detection PyTorch segment-anything yolov5 yolov8

Python 2.21 k

23 天前

hyp1231 / awesome-llm-powered-agent

#Awesome#Awesome things about LLM-powered agents. Papers / Repos / Blogs / ...

Awesome Lists embodied-agent embodied-ai foundation-model foundation-models generative-agents generative-ai generative-model generative-models large-language-model large-language-models llms 大语言模型 ChatGPT gpt-4

1.96 k

17 天前

KaiyangZhou / CoOp

Prompt Learning for Vision-Language Models (IJCV'22, CVPR'22)

foundation-models multimodal-learning prompt-learning

Python 1.93 k

1 年前

OpenGVLab / InternVideo

[ECCV2024] Video Foundation Models & Data for Multimodal Understanding

foundation-models video-understanding vision-transformer action-recognition multimodal temporal-action-localization video-question-answering zero-shot-classification benchmark contrastive-learning self-supervised instruction-tuning video-clip

Python 1.8 k

4 天前

tatsu-lab / alpaca_eval

#自然语言处理#An automatic evaluator for instruction-following language models. Human-validated, high-quality, cheap, and fast.

深度学习 evaluation foundation-models instruction-following large-language-models leaderboard 自然语言处理 rlhf

Jupyter Notebook 1.72 k

4 个月前

baaivision / Emu

Emu Series: Generative Multimodal Models from BAAI

foundation-models in-context-learning instruct-tuning multimodal-pretraining generative-pretraining-in-multimodality multimodal-generalist

Python 1.71 k

7 个月前

time-series-foundation-models / lag-llama

#时序数据库#Lag-Llama: Towards Foundation Models for Probabilistic Time Series Forecasting

forecasting foundation-models time-series time-series-forecasting timeseries timeseries-forecasting llama time-series-prediction time-series-transformer transformers

Python 1.41 k

2 个月前