跨平台统一运行时 C 语言接口 InfiniRT & 微型 C++ 大模型推理引擎 InfiniInfer

使用方式

配置 XMake（选择硬件平台）

xmake f [--nv-gpu/--ascend-npu]=true -cv

设置 INFINI_ROOT 环境变量（推荐，默认安装地址为 $HOME/.infini）

export INFINI_ROOT=$HOME/.infini
export LD_LIBRARY_PATH=$INFINI_ROOT/lib:$LD_LIBRARY_PATH

需要先编译和部署运行时和推理引擎

python test/model/test_llama.py --cuda path/to/model/dir/

Name		Name	Last commit message	Last commit date
Latest commit History 91 Commits
include		include
src		src
test		test
.clang-format		.clang-format
.gitignore		.gitignore
README.md		README.md
xmake.lua		xmake.lua