🐼 llama

👇 6 Elementos

ollama

108.1k Go MIT

Get up and running with Llama 3.3, Phi 4, Gemma 2, and other large language models.

1 hace 1 año(s) hace 1 mese(s)

vllm

33.9k Python Apache-2.0

A high-throughput and memory-efficient inference and serving engine for LLMs

1 hace 2 año(s) hace 1 mese(s)

Langchain-Chatchat

33.3k TypeScript Apache-2.0

Langchain-Chatchat(原Langchain-ChatGLM)基于 Langchain 与 ChatGLM, Qwen 与 Llama 等语言模型的 RAG 与 Agent 应用 | Langchain-Chatchat (formerly langchain-ChatGLM), local knowledge based LLM (like ChatGLM, Qwen and Llama) RAG and Agent app with langchain

1 hace 1 año(s) hace 1 mese(s)

llama.cpp

74.7k C++ MIT

LLM inference in C/C++

1 hace 2 año(s) hace 23 día(s)

LLaMA-Factory

43.2k Python Apache-2.0

Unified Efficient Fine-Tuning of 100+ LLMs & VLMs (ACL 2024)

1 hace 1 año(s) hace 7 día(s)

LocalAI

30k Go MIT

:robot: The free, Open Source alternative to OpenAI, Claude and others. Self-hosted and local-first. Drop-in replacement for OpenAI, running on consumer-grade hardware. No GPU required. Runs gguf, transformers, diffusers and many more models architectures. Features: Generate Text, Audio, Video, Images, Voice Cloning, Distributed, P2P inference

1 hace 1 año(s) hace 2 día(s)