Ollama là một phần mềm mã nguồn mở cho phép bạn chạy các mô hình AI ngôn ngữ lớn (LLM) trực tiếp trên máy của mình, thay vì gửi dữ liệu lên server đám mây như ChatGPT.
Ollama = công cụ chạy AI “local” (trên máy cá nhân)
- Bạn tải model về máy (Llama, Qwen, DeepSeek, Gemma, …)
- AI chạy hoàn toàn offline (sau khi tải xong)
- Dữ liệu không rời khỏi máy
- Không cần trả phí theo token
B1: thực hiện cài đặt ollama

B2: Kiểm tra xem ollama đã chạy chưa

Nếu chưa thấy ollama thì dung lệnh sau để start: ollama serve
B3: Kiểm tra ip port để kết nối đến ollama

B4: pull model AI về

B5: Thử kiểm tra với ollama đã cài đặt

