ggml-org/llama.cpp

changelog : libllama API
#9289 · ggerganov opened on Sep 3, 2024
9
changelog : llama-server REST API
#9291 · ggerganov opened on Sep 3, 2024
16
tutorials : list for llama.cpp
#13523 · ggerganov opened on May 14, 2025
5

state:open label:Vulkan

Labels Milestones New issue

Open

Closed

ggml : support broadcast for ggml_soft_max_ext and ggml_flash_attn_ext

ggml-org/llama.cpp

#14435

· ggerganov opened

on Jun 28, 2025

vulkan: Add fusion support for RMS_NORM+MUL

ggml

testing

Vulkan

ggml-org/llama.cpp

#14366

· jeffbolznv opened

on Jun 24, 2025

ggml: adds CONV_2D op and direct GEMM Vulkan implementation

ggml

testing

Vulkan

ggml-org/llama.cpp

#14316

· etasnadi opened

on Jun 21, 2025

ggml : implement REGLU/GEGLU/SWIGLU ops

ggml-org/llama.cpp

#14158

· CISC opened

on Jun 12, 2025

Fix Vulkan glslc invocation command lines

ggml

Vulkan

ggml-org/llama.cpp

#13289

· kangalio opened

on May 3, 2025

llama : try loading tensors with pre-computed hashes

ggml-org/llama.cpp

#13106

· rgerganov opened

on Apr 25, 2025

llama-server : implement universal assisted decoding

ggml-org/llama.cpp

#12635

· g2mt opened

on Mar 28, 2025

Vulkan: Remove dedicated aligned matrix matrix multiplication shaders

ggml

testing

Vulkan

ggml-org/llama.cpp

#12515

· 0cc4m opened

on Mar 22, 2025

Fixed Eval Bug: 12163 : Fallback to CPU when loading model: vk::PhysicalDevice::createDevice: ErrorExtensionNotPresent.

ggml

Vulkan

ggml-org/llama.cpp

#12329

· ashwini778 opened

on Mar 11, 2025

<code>tool-call</code>: Phi-4 support

ggml-org/llama.cpp

#12288

· jpohhhh opened

on Mar 9, 2025

vulkan: optimization proposals for coopmat1 mul_mm

ggml

Vulkan

ggml-org/llama.cpp

#12260

· remyoudompheng opened

on Mar 7, 2025

vulkan : add GGML_VK_FORCE_HEAP_INDEX env var

ggml

Vulkan

ggml-org/llama.cpp

#9734

· gyf304 opened

on Oct 4, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

ggml : support broadcast for ggml_soft_max_ext and ggml_flash_attn_ext

vulkan: Add fusion support for RMS_NORM+MUL

ggml: adds CONV_2D op and direct GEMM Vulkan implementation

ggml : implement REGLU/GEGLU/SWIGLU ops

Fix Vulkan glslc invocation command lines

llama : try loading tensors with pre-computed hashes

llama-server : implement universal assisted decoding

Vulkan: Remove dedicated aligned matrix matrix multiplication shaders

Fixed Eval Bug: 12163 : Fallback to CPU when loading model: vk::PhysicalDevice::createDevice: ErrorExtensionNotPresent.

<code>tool-call</code>: Phi-4 support

vulkan: optimization proposals for coopmat1 mul_mm

vulkan : add GGML_VK_FORCE_HEAP_INDEX env var

Search code, repositories, users, issues, pull requests...

Issues

Search results