Engage!

author: Mitja Felicijan <mitja.felicijan@gmail.com> 2026-02-12 20:57:17 +0100
committer: Mitja Felicijan <mitja.felicijan@gmail.com> 2026-02-12 20:57:17 +0100
commit: b333b06772c89d96aacb5490d6a219fba7c09cc6 (patch)
tree: 211df60083a5946baa2ed61d33d8121b7e251b06 /llama.cpp/tools/server/tests/unit/test_basic.py
download: llmnpc-b333b06772c89d96aacb5490d6a219fba7c09cc6.tar.gz
1 files changed, 96 insertions, 0 deletions
diff --git a/llama.cpp/tools/server/tests/unit/test_basic.py b/llama.cpp/tools/server/tests/unit/test_basic.py
new file mode 100644
index 0000000..3405be3
--- /dev/null
+++ b/llama.cpp/tools/server/tests/unit/test_basic.py
@@ -0,0 +1,96 @@
+import pytest
+import requests
+from utils import *
+server = ServerPreset.tinyllama2()
+@pytest.fixture(autouse=True)
+def create_server():
+    global server
+    server = ServerPreset.tinyllama2()
+def test_server_start_simple():
+    global server
+    server.start()
+    res = server.make_request("GET", "/health")
+    assert res.status_code == 200
+def test_server_props():
+    global server
+    server.start()
+    res = server.make_request("GET", "/props")
+    assert res.status_code == 200
+    assert ".gguf" in res.body["model_path"]
+    assert res.body["total_slots"] == server.n_slots
+    default_val = res.body["default_generation_settings"]
+    assert server.n_ctx is not None and server.n_slots is not None
+    assert default_val["n_ctx"] == server.n_ctx / server.n_slots
+    assert default_val["params"]["seed"] == server.seed
+def test_server_models():
+    global server
+    server.start()
+    res = server.make_request("GET", "/models")
+    assert res.status_code == 200
+    assert len(res.body["data"]) == 1
+    assert res.body["data"][0]["id"] == server.model_alias
+def test_server_slots():
+    global server
+    # without slots endpoint enabled, this should return error
+    server.server_slots = False
+    server.start()
+    res = server.make_request("GET", "/slots")
+    assert res.status_code == 501 # ERROR_TYPE_NOT_SUPPORTED
+    assert "error" in res.body
+    server.stop()
+    # with slots endpoint enabled, this should return slots info
+    server.server_slots = True
+    server.n_slots = 2
+    server.start()
+    res = server.make_request("GET", "/slots")
+    assert res.status_code == 200
+    assert len(res.body) == server.n_slots
+    assert server.n_ctx is not None and server.n_slots is not None
+    assert res.body[0]["n_ctx"] == server.n_ctx / server.n_slots
+    assert "params" not in res.body[0]
+def test_load_split_model():
+    global server
+    server.offline = False
+    server.model_hf_repo = "ggml-org/models"
+    server.model_hf_file = "tinyllamas/split/stories15M-q8_0-00001-of-00003.gguf"
+    server.model_alias = "tinyllama-split"
+    server.start()
+    res = server.make_request("POST", "/completion", data={
+        "n_predict": 16,
+        "prompt": "Hello",
+        "temperature": 0.0,
+    })
+    assert res.status_code == 200
+    assert match_regex("(little|girl)+", res.body["content"])
+def test_no_webui():
+    global server
+    # default: webui enabled
+    server.start()
+    url = f"http://{server.server_host}:{server.server_port}"
+    res = requests.get(url)
+    assert res.status_code == 200
+    assert "<!doctype html>" in res.text
+    server.stop()
+    # with --no-webui
+    server.no_webui = True
+    server.start()
+    res = requests.get(url)
+    assert res.status_code == 404
author	Mitja Felicijan <mitja.felicijan@gmail.com>	2026-02-12 20:57:17 +0100
committer	Mitja Felicijan <mitja.felicijan@gmail.com>	2026-02-12 20:57:17 +0100
commit	b333b06772c89d96aacb5490d6a219fba7c09cc6 (patch)
tree	211df60083a5946baa2ed61d33d8121b7e251b06 /llama.cpp/tools/server/tests/unit/test_basic.py
download	llmnpc-b333b06772c89d96aacb5490d6a219fba7c09cc6.tar.gz

diff --git a/llama.cpp/tools/server/tests/unit/test_basic.py b/llama.cpp/tools/server/tests/unit/test_basic.py new file mode 100644 index 0000000..3405be3 --- /dev/null +++ b/llama.cpp/tools/server/tests/unit/test_basic.py
@@ -0,0 +1,96 @@
	1	import pytest
	2	import requests
	3	from utils import *
	4
	5	server = ServerPreset.tinyllama2()
	6
	7
	8	@pytest.fixture(autouse=True)
	9	def create_server():
	10	global server
	11	server = ServerPreset.tinyllama2()
	12
	13
	14	def test_server_start_simple():
	15	global server
	16	server.start()
	17	res = server.make_request("GET", "/health")
	18	assert res.status_code == 200
	19
	20
	21	def test_server_props():
	22	global server
	23	server.start()
	24	res = server.make_request("GET", "/props")
	25	assert res.status_code == 200
	26	assert ".gguf" in res.body["model_path"]
	27	assert res.body["total_slots"] == server.n_slots
	28	default_val = res.body["default_generation_settings"]
	29	assert server.n_ctx is not None and server.n_slots is not None
	30	assert default_val["n_ctx"] == server.n_ctx / server.n_slots
	31	assert default_val["params"]["seed"] == server.seed
	32
	33
	34	def test_server_models():
	35	global server
	36	server.start()
	37	res = server.make_request("GET", "/models")
	38	assert res.status_code == 200
	39	assert len(res.body["data"]) == 1
	40	assert res.body["data"][0]["id"] == server.model_alias
	41
	42
	43	def test_server_slots():
	44	global server
	45
	46	# without slots endpoint enabled, this should return error
	47	server.server_slots = False
	48	server.start()
	49	res = server.make_request("GET", "/slots")
	50	assert res.status_code == 501 # ERROR_TYPE_NOT_SUPPORTED
	51	assert "error" in res.body
	52	server.stop()
	53
	54	# with slots endpoint enabled, this should return slots info
	55	server.server_slots = True
	56	server.n_slots = 2
	57	server.start()
	58	res = server.make_request("GET", "/slots")
	59	assert res.status_code == 200
	60	assert len(res.body) == server.n_slots
	61	assert server.n_ctx is not None and server.n_slots is not None
	62	assert res.body[0]["n_ctx"] == server.n_ctx / server.n_slots
	63	assert "params" not in res.body[0]
	64
	65
	66	def test_load_split_model():
	67	global server
	68	server.offline = False
	69	server.model_hf_repo = "ggml-org/models"
	70	server.model_hf_file = "tinyllamas/split/stories15M-q8_0-00001-of-00003.gguf"
	71	server.model_alias = "tinyllama-split"
	72	server.start()
	73	res = server.make_request("POST", "/completion", data={
	74	"n_predict": 16,
	75	"prompt": "Hello",
	76	"temperature": 0.0,
	77	})
	78	assert res.status_code == 200
	79	assert match_regex("(little\|girl)+", res.body["content"])
	80
	81
	82	def test_no_webui():
	83	global server
	84	# default: webui enabled
	85	server.start()
	86	url = f"http://{server.server_host}:{server.server_port}"
	87	res = requests.get(url)
	88	assert res.status_code == 200
	89	assert "<!doctype html>" in res.text
	90	server.stop()
	91
	92	# with --no-webui
	93	server.no_webui = True
	94	server.start()
	95	res = requests.get(url)
	96	assert res.status_code == 404