GitHub 中文社区

回车: Github搜索 Shift+回车: Google搜索

©2023 GitHub中文社区论坛 GitHub官网网站地图 GitHub官方翻译

GitHub on X
GitHub on Facebook
GitHub on LinkedIn
GitHub on YouTube
GitHub on Twitch
GitHub on TikTok
GitHub’s organization on GitHub

”llm-evaluation-framework“ 的搜索结果

The LLM Evaluation Framework

evaluation-metrics evaluation-framework llm-evaluation llm-evaluation-framework llm-evaluation-metrics

Python3.83 k

1 天前

Google Bing GitHub

llmops ai chatgpt large-language-models prompt-engineering model-monitoring agent mlops evaluation llm

Evals is a framework for evaluating LLMs and LLM systems, and an open-source registry of benchmarks.

Python15.1 k

2 个月前

A framework for serving and evaluating LLM routers - save LLM costs without compromising quality!

Python3.3 k

4 个月前

#大语言模型#A framework to evaluate the generalization capability of safety alignment for LLMs

alignment jailbreak large-language-models llm Security

Python569

4 个月前

#计算机科学#Evidently is an open-source ML and LLM observability framework. Evaluate, test, and monitor any AI-powered system or data pipeline. From tabular data to Gen AI. 100+ metrics.

data-drift Jupyter Notebook pandas-dataframe 机器学习 model-monitoring

Jupyter Notebook5.46 k

3 小时前

Framework for LLM evaluation, guardrails and security

Python96

3 个月前

Open source platform for AI Engineering: OpenTelemetry-native LLM Observability, GPU Monitoring, Guardrails, Evaluations, Prompt Management, Vault, Playground. 🚀💻 Integrates with 40+ LLM Providers, ...

Python892

3 天前

Python SDK for Agent AI Observability, Monitoring and Evaluation Framework. Includes features like agent, llm and tools tracing, debugging multi-agentic system, self-hosted dashboard and advanced anal...

TypeScript1.1 k

9 天前

Langtrace 🔍 is an open-source, Open Telemetry based end-to-end observability tool for LLM applications, providing real-time tracing, evaluations and metrics for popular LLMs, LLM frameworks, vectorD...

TypeScript605

3 天前

Framework to evaluate LLM generated ReactJS code.

TypeScript51

8 个月前

Evaluation and Tracking for LLM Experiments

Python2.2 k

2 天前

Evaluation tool for LLM QA chains

Python1.06 k

2 年前

An open-source visual programming environment for battle-testing prompts to LLMs.

人工智能 evaluation large-language-models llmops llms

TypeScript2.38 k

1 个月前

@pamela-project

SLAM performance evaluation framework

C++316

8 个月前

#大语言模型#LlamaIndex is a data framework for your LLM applications

agents application data fine-tuning Framework

Python37.04 k

11 小时前

a lightweight LLM model inference framework

C++700

8 个月前

A Neural Framework for MT Evaluation

Python510

2 天前

@OpenNetworkingFoundation

PROJECT DELTA: SDN SECURITY EVALUATION FRAMEWORK

221

6 年前

Microsoft@microsoft

#大语言模型#A unified evaluation framework for large language models

adversarial-attacks ChatGPT evaluation large-language-models robustness

Python2.48 k

1 个月前

lm-evaluation-harness

A framework for few-shot evaluation of language models.

evaluation-framework language-model transformer

Python7.09 k

6 小时前

@explodinggradients

#大语言模型#Supercharge Your LLM Application Evaluations 🚀

llm llmops evaluation

Python7.38 k

8 小时前

AI Observability & Evaluation

ml-observability model-observability ai-roi llmops mlops

Jupyter Notebook4.05 k

2 天前

@FreedomIntelligence

⚡LLM Zoo is a project that provides data, models, and evaluation benchmark for large language models.⚡

Python2.93 k

1 年前

#大语言模型#A lightweight framework for building LLM-based agents

agent gpt llm transformers

Python1.88 k

4 天前

@remotebiosensing

Benchmark Framework for fair evaluation of rPPG

Python257

1 年前

Python Framework for Saliency Modeling and Evaluation

Jupyter Notebook154

18 天前

#计算机科学#🐢 Open-Source Evaluation & Testing for ML & LLM systems

机器学习 artificial-intelligence mlops quality-assurance machine-learning-testing

Python4.1 k

7 天前

Data framework for your LLM applications. Focus on server side solution

agent anthr Chat Bot claude claude-ai

TypeScript1.98 k

4 小时前

Well tested & Multi-language evaluation framework for text summarization.

Python613

2 年前

loading...

编程语音

Python
Java
JavaScript
C++
C#
PHP
TypeScript
Go
C
Jupyter Notebook