Commit e0de42a

Update to VectorDB

Author	Mitja Felicijan <mitja.felicijan@gmail.com>	2026-02-18 15:14:13 +0100
Committer	Mitja Felicijan <mitja.felicijan@gmail.com>	2026-02-18 15:14:13 +0100
Commit	`e0de42af0b2c51ed9607a477cbdb556f44bac4f7` (patch)

`-rw-r--r--`	.gitignore	1
`-rw-r--r--`	Makefile	15
`-rw-r--r--`	context.c	5
`-rw-r--r--`	npc.c	6
`-rw-r--r--`	vectordb.c	87
`-rw-r--r--`	vectordb.h	39

6 files changed, 106 insertions, 47 deletions

diff --git a/.gitignore b/.gitignore
...
3	prompt	3	prompt
4	context	4	context
5	npc	5	npc
		6	game
6		7
7	# Other files	8	# Other files
8	.DS_Store	9	.DS_Store
...

 help: .help
-build/npc: build/prompts npc.c vectordb.c models.h # Build npc binary for testing
-	$(CC) $(CFLAGS) npc.c vectordb.c -o npc $(LDFLAGS)
-build/context: context.c vectordb.c models.h # Build context binary for testing
-	$(CC) $(CFLAGS) context.c vectordb.c -o context $(LDFLAGS)
 build/llama.cpp: .assure # Build llama.cpp libraries
 	mkdir $(LLAMA_DIR)/build && \
 		cd $(LLAMA_DIR)/build && \
 		cmake ../ -DBUILD_SHARED_LIBS=OFF && \
 		make -j8
+build/context: context.c vectordb.c models.h # Build context binary for testing
+	$(CC) $(CFLAGS) context.c vectordb.c -o context $(LDFLAGS)
+build/npc: build/prompts npc.c vectordb.c models.h # Build npc binary for testing
+	$(CC) $(CFLAGS) npc.c vectordb.c -o npc $(LDFLAGS)
+build/game: build/prompts game.c vectordb.c models.h # Build npc binary for testing
+	$(CC) $(CFLAGS) game.c vectordb.c -o game $(LDFLAGS)
 build/prompts: $(PROMPT_HEADERS) # Generate C style header

 		vdb_add_document(&db, line);
 	}
-	if (vdb_save(&db, out_file) > 0) {
+	VectorDBErrorCode vdb_rc = vdb_save(&db, out_file);
-		log_message(stderr, LOG_ERROR, "Something went wrong saving file %s", out_file);
+	if (vdb_rc != VDB_SUCCESS) {
+		log_message(stderr, LOG_ERROR, "Something went wrong saving file %s: %s", out_file, vdb_error(vdb_rc));
 		fclose(context_fp);
 		return 1;
 	}

diff --git a/npc.c b/npc.c
...
340		340
341	VectorDB db = {};	341	VectorDB db = {};
342	vdb_init(&db, embed_ctx);	342	vdb_init(&db, embed_ctx);
343	int vdb_rc = vdb_load(&db, context_file);	343	VectorDBErrorCode vdb_rc = vdb_load(&db, context_file);
344	if (vdb_rc != 0) {	344	if (vdb_rc != VDB_SUCCESS) {
345	log_message(stderr, LOG_ERROR, "Failed to load vector database %s (err %d)", context_file, vdb_rc);	345	log_message(stderr, LOG_ERROR, "Failed to load vector database %s: %s", context_file, vdb_error(vdb_rc));
346	llama_free(embed_ctx);	346	llama_free(embed_ctx);
347	llama_model_free(model);	347	llama_model_free(model);
348	llama_backend_free();	348	llama_backend_free();
...

 #include "llama.h"
 #include "vectordb.h"
-#include "nonstd.h"
-#define VDB_MAGIC 0x31424456u /* "VDB1" */
+// Returns cosine similarity in range [-1, 1] (approx).
-#define VDB_VERSION 1u
+// https://en.wikipedia.org/wiki/Cosine_similarity
-typedef struct {
-	uint32_t magic;
-	uint32_t version;
-	uint32_t embed_size;
-	uint32_t max_text;
-	uint32_t count;
-} VdbFileHeader;
 static float cosine_similarity(float *a, float *b, int n) {
 	float dot = 0, norm_a = 0, norm_b = 0;
 	for (int i = 0; i < n; i++) {
 }
 static void embed_text(struct llama_context *ctx, const char *text, float *out) {
-	llama_token tokens[512];
+	llama_token tokens[VDB_TOKENS];
 	const struct llama_model *model = llama_get_model(ctx);
 	const struct llama_vocab *vocab = llama_model_get_vocab(model);
-	int n_tokens = llama_tokenize(vocab, text, strlen(text), tokens, 512, true, true);
+	int n_tokens = llama_tokenize(vocab, text, strlen(text), tokens, VDB_TOKENS, true, true);
 	if (n_tokens < 0) {
 		return;
 	}
 void vdb_add_document(VectorDB *db, const char *text) {
 	if (db->count >= VDB_MAX_DOCS) {
-		log_message(stdout, LOG_INFO, "Vector database full");
+		printf("Vector database full\n");
 		return;
 	}
 	strncpy(doc->text, text, VDB_MAX_TEXT - 1);
 	doc->text[VDB_MAX_TEXT - 1] = 0;
-	log_message(stdout, LOG_INFO, "Embedding doc %d...", db->count);
+	printf("Embedding doc %d...\n", db->count);
 	embed_text(db->embed_ctx, text, doc->embedding);
 }
 	}
 }
-int vdb_save(const VectorDB *db, const char *path) {
+VectorDBErrorCode vdb_save(const VectorDB *db, const char *path) {
 	FILE *fp = fopen(path, "wb");
 	if (!fp) {
-		return 1;
+		return VDB_OPEN_ERR;
 	}
 	VdbFileHeader header = {
 	if (fwrite(&header, sizeof(header), 1, fp) != 1) {
 		fclose(fp);
-		return 2;
+		return VDB_HEADER_WRITE_ERR;
 	}
 	if (db->count > 0) {
 		size_t wrote = fwrite(db->docs, sizeof(VectorDoc), (size_t)db->count, fp);
 		if (wrote != (size_t)db->count) {
 			fclose(fp);
-			return 3;
+			return VDB_DOC_WRITE_ERR;
 		}
 	}
 	if (fclose(fp) != 0) {
-		return 4;
+		return VDB_CLOSE_ERR;
 	}
-	return 0;
+	return VDB_SUCCESS;
 }
-int vdb_load(VectorDB *db, const char *path) {
+VectorDBErrorCode vdb_load(VectorDB *db, const char *path) {
 	struct llama_context *ctx = db->embed_ctx;
 	FILE *fp = fopen(path, "rb");
 	if (!fp) {
-		return -1;
+		int open_err = errno;
+		fprintf(stderr, "vdb_load: open failed: %s\n", strerror(open_err));
+		return VDB_OPEN_ERR;
 	}
 	VdbFileHeader header = {0};
 	if (fread(&header, sizeof(header), 1, fp) != 1) {
+		int read_err = errno;
+		fprintf(stderr, "vdb_load: header read failed: %s\n", strerror(read_err));
 		fclose(fp);
-		return -2;
+		return VDB_HEADER_READ_ERR;
 	}
 	if (header.magic != VDB_MAGIC || header.version != VDB_VERSION) {
 		fclose(fp);
-		return -3;
+		return VDB_MAGIC_MISMATCH_ERR;
 	}
 	if (header.embed_size != VDB_EMBED_SIZE || header.max_text != VDB_MAX_TEXT) {
 		fclose(fp);
-		return -4;
+		return VDB_EMBED_MISMATCH_ERR;
 	}
 	if (header.count > VDB_MAX_DOCS) {
 		fclose(fp);
-		return -5;
+		return VDB_COUNT_TOO_LARGE_ERR;
 	}
 	memset(db, 0, sizeof(VectorDB));
 	if (db->count > 0) {
 		size_t read = fread(db->docs, sizeof(VectorDoc), (size_t)db->count, fp);
 		if (read != (size_t)db->count) {
+			int read_err = errno;
+			fprintf(stderr, "vdb_load: doc read failed: %s\n", strerror(read_err));
 			fclose(fp);
-			return -6;
+			return VDB_DOC_READ_ERR;
 		}
 	}
 	if (fclose(fp) != 0) {
-		return -7;
+		int close_err = errno;
+		fprintf(stderr, "vdb_load: close failed: %s\n", strerror(close_err));
+		return VDB_CLOSE_ERR;
 	}
-	return 0;
+	return VDB_SUCCESS;
+}
+const char* vdb_error(VectorDBErrorCode err) {
+	switch (err) {
+		case VDB_SUCCESS:
+			return "Success.";
+		case VDB_OPEN_ERR:
+			return "Failed to open file.";
+		case VDB_CLOSE_ERR:
+			return "Failed to close file.";
+		case VDB_HEADER_WRITE_ERR:
+			return "Failed to write header.";
+		case VDB_HEADER_READ_ERR:
+			return "Failed to read header.";
+		case VDB_MAGIC_MISMATCH_ERR:
+			return "Header magic/version mismatch.";
+		case VDB_EMBED_MISMATCH_ERR:
+			return "Header embed/max_text mismatch.";
+		case VDB_COUNT_TOO_LARGE_ERR:
+			return "Header count too large.";
+		case VDB_DOC_WRITE_ERR:
+			return "Failed to write documents.";
+		case VDB_DOC_READ_ERR:
+			return "Failed to read documents.";
+		default:
+			return "Unknown error.";
+	}
 }



  
#include "llama.h"
  
#include <errno.h>
  
#define VDB_MAX_DOCS    1000
#define VDB_EMBED_SIZE  768
#define VDB_MAX_TEXT    1024
  
#define VDB_MAGIC       0x31424456u /* "VDB1" */
#define VDB_VERSION     1u
#define VDB_TOKENS      512
  
typedef struct {
	float embedding[VDB_EMBED_SIZE];

	struct llama_context *embed_ctx;
} VectorDB;
  
typedef struct {
	uint32_t magic;
	uint32_t version;
	uint32_t embed_size;
	uint32_t max_text;
	uint32_t count;
} VdbFileHeader;
  
typedef enum {
	VDB_SUCCESS                = 0,
	VDB_OPEN_ERR               = 9001,
	VDB_CLOSE_ERR              = 9002,
	VDB_HEADER_WRITE_ERR       = 9003,
	VDB_HEADER_READ_ERR        = 9004,
	VDB_MAGIC_MISMATCH_ERR     = 9005,
	VDB_EMBED_MISMATCH_ERR     = 9006,
	VDB_COUNT_TOO_LARGE_ERR    = 9007,
	VDB_DOC_WRITE_ERR          = 9008,
	VDB_DOC_READ_ERR           = 9009,
} VectorDBErrorCode;
  
void vdb_init(VectorDB *db, struct llama_context *embed_ctx);
void vdb_free(VectorDB *db);
  

void vdb_embed_query(VectorDB *db, const char *text, float *out_embedding);
void vdb_search(VectorDB *db, float *query_embedding, int top_k, int *results);
  
VectorDBErrorCode vdb_save(const VectorDB *db, const char *path);
VectorDBErrorCode vdb_load(VectorDB *db, const char *path);
  
const char* vdb_error(VectorDBErrorCode err);
  
#endif

diff --git a/vectordb.h b/vectordb.h
...
3		3
4	#include "llama.h"	4	#include "llama.h"
5		5
6	#define VDB_MAX_DOCS 1000	6	#include <errno.h>
7	#define VDB_EMBED_SIZE 768	7
8	#define VDB_MAX_TEXT 1024	8	#define VDB_MAX_DOCS 1000
		9	#define VDB_EMBED_SIZE 768
		10	#define VDB_MAX_TEXT 1024
		11
		12	#define VDB_MAGIC 0x31424456u /* "VDB1" */
		13	#define VDB_VERSION 1u
		14	#define VDB_TOKENS 512
9		15
10	typedef struct {	16	typedef struct {
11	float embedding[VDB_EMBED_SIZE];	17	float embedding[VDB_EMBED_SIZE];
...
18	struct llama_context *embed_ctx;	24	struct llama_context *embed_ctx;
19	} VectorDB;	25	} VectorDB;
20		26
		27	typedef struct {
		28	uint32_t magic;
		29	uint32_t version;
		30	uint32_t embed_size;
		31	uint32_t max_text;
		32	uint32_t count;
		33	} VdbFileHeader;
		34
		35	typedef enum {
		36	VDB_SUCCESS = 0,
		37	VDB_OPEN_ERR = 9001,
		38	VDB_CLOSE_ERR = 9002,
		39	VDB_HEADER_WRITE_ERR = 9003,
		40	VDB_HEADER_READ_ERR = 9004,
		41	VDB_MAGIC_MISMATCH_ERR = 9005,
		42	VDB_EMBED_MISMATCH_ERR = 9006,
		43	VDB_COUNT_TOO_LARGE_ERR = 9007,
		44	VDB_DOC_WRITE_ERR = 9008,
		45	VDB_DOC_READ_ERR = 9009,
		46	} VectorDBErrorCode;
		47
21	void vdb_init(VectorDB db, struct llama_context embed_ctx);	48	void vdb_init(VectorDB db, struct llama_context embed_ctx);
22	void vdb_free(VectorDB *db);	49	void vdb_free(VectorDB *db);
23		50
...
26	void vdb_embed_query(VectorDB db, const char text, float *out_embedding);	53	void vdb_embed_query(VectorDB db, const char text, float *out_embedding);
27	void vdb_search(VectorDB db, float query_embedding, int top_k, int *results);	54	void vdb_search(VectorDB db, float query_embedding, int top_k, int *results);
28		55
29	int vdb_save(const VectorDB db, const char path);	56	VectorDBErrorCode vdb_save(const VectorDB db, const char path);
30	int vdb_load(VectorDB db, const char path);	57	VectorDBErrorCode vdb_load(VectorDB db, const char path);
		58
		59	const char* vdb_error(VectorDBErrorCode err);
31		60
32	#endif	61	#endif