VieNeu‑TTS

VietNeu-TTS

1. VieNeu‑TTS là gì

VieNeu‑TTS là một mô hình Text‑to‑Speech (chuyển văn bản thành giọng nói) tiếng Việt chạy hoàn toàn offline trên máy cá nhân (CPU hoặc GPU), do tác giả Phạm Nguyễn Ngọc Bảo phát triển. Mô hình nổi bật với khả năng nhân bản giọng nói tức thì (voice cloning) và chạy thời gian thực trên CPU.

Các đặc điểm chính

  • Tiếng Việt tự nhiên, 24 kHz, hỗ trợ giọng Bắc/Nam, nam/nữ.
  • Chạy offline 100%, không cần internet khi đọc.
  • Voice cloning: chỉ cần 3–5 giây audio mẫu để clone giọng nói bất kỳ.
  • Chạy tốt trên CPU (đặc biệt bản v2‑Turbo) – phù hợp cả máy yếu.
  • Mã nguồn mở (Apache‑2.0), dùng được cho nghiên cứu và thương mại.

Phù hợp cho: đọc truyện/audio book, video YouTube, trợ lý ảo, học phát âm, phần mềm đọc văn bản.

2. Cài đặt

Hiện có 2 cách phổ biến:

  • Cách dễ: cài bằng python package (pip install vieneu)
  • Cách đầy đủ: clone github+web ui (gradio)

Mình sẽ sử dụng cài đặt cách đầy đủ trên ubuntu-wls, hiện tại minh sẽ dung GPU RTX-3050

B1: Kiểm tra GPU

B2: cài đặt espeak-ng

B3: Git clone

B4: Cài đặt dependency cho GPU/standard

B5: Bạn có thể start với web

B6: chọn tải model và bắt đầu trải nghiệm

B7: Hiện tại mình đang dung cách này để đọc truyện audio, sau đó tạo video youtube, nên thường minh sẽ dung code python.

Leave a Reply

Your email address will not be published. Required fields are marked *