Hungcy Voice Studio

Vietnamese & Multi-Language Voice Engine

Đang kiểm tra...
Mẹo: Sử dụng dấu phẩy , hoặc ... để ngắt nhịp ngắn, dấu chấm . để dừng lâu hơn.
Đang tải danh sách...
Tối đa: 0
1.0x
0.667
0.2s

Tải trực tiếp lên Google Drive

Kiểm tra kết nối Drive...

Nhấn nút "Tạo Giọng Nói" ở khung bên trái để nghe kết quả chuyển đổi.

Yêu cầu xác thực Google Drive

Vui lòng nhập mật khẩu xác thực để truy cập và xem thư viện lưu trữ Google Drive.

Nhấp vào biểu tượng đám mây để chọn tệp Chọn đồng thời tệp .onnx và tệp .onnx.json cấu hình của model.
Chọn đồng thời file .onnx và file cấu hình .onnx.json để tải lên cùng lúc.
Chèn các thẻ như [cuoi], [hat_xi], [tho_dai], [ngap], [vo_tay] vào ô văn bản. Bạn có thể tải lên tệp **WAV 22050Hz Mono** của riêng bạn để tùy chỉnh âm thanh cảm xúc, hoặc để mặc định làm khoảng lặng tự nhiên.

Studio Huấn Luyện Giọng Nói (Training Studio)

Tự tạo tập dữ liệu huấn luyện (Dataset) giọng nói của riêng bạn
Ghi âm trực tiếp các câu mẫu dưới đây bằng micro của bạn. Hệ thống sẽ tự động chuyển đổi sang định dạng tiêu chuẩn **WAV 22050Hz Mono** và đóng gói thành tệp **.zip** kèm file `metadata.csv` tương thích 100% để huấn luyện trên Google Colab.
Câu mẫu 1/14 22.05kHz WAV Mono
Đang tải câu mẫu ghi âm...
Trạng thái danh sách câu

Công cụ Huấn luyện & Xuất Mô hình (ONNX)

Sử dụng Notebook Colab hoặc xuất file mô hình ONNX để đưa vào sử dụng

Huấn luyện đám mây (GPU - Khuyên dùng)

Sử dụng GPU đám mây miễn phí trên Google Colab để huấn luyện giọng nói nhanh gấp 50 lần so với máy tính cục bộ.

  1. Ghi âm câu mẫu tại Studio Huấn Luyện ở trên.
  2. Bấm Tải về Dataset để nhận tệp ZIP.
  3. Tải tệp ZIP đó lên Google Drive cá nhân của bạn.
  4. Mở Colab theo liên kết bên dưới và chạy huấn luyện để nhận checkpoint .ckpt.

Công cụ Xuất Mô hình (ONNX)

Chuyển đổi mô hình checkpoint đã huấn luyện (.ckpt) sang định dạng ONNX (.onnx.onnx.json) để chạy trên server.

Hướng dẫn & Câu hỏi thường gặp (FAQ)

Nhấp vào câu hỏi để xem câu trả lời chi tiết
1. Làm thế nào để tự tạo giọng đọc (clone giọng nói) của riêng tôi?
Quy trình gồm 4 bước đơn giản:
Bước 1: Xuống mục Studio Huấn Luyện bên dưới, bật micro và ghi âm 14 câu mẫu bằng giọng đọc của bạn.
Bước 2: Bấm Tải về Dataset để nhận file ZIP chứa giọng đọc của bạn.
Bước 3: Mở link Google Colab (trong mục Công cụ Notebook), tải file ZIP lên và chạy các bước huấn luyện để tạo file mô hình .ckpt.
Bước 4: Dùng công cụ Xuất ONNX bên dưới để chuyển file checkpoint sang định dạng .onnx.onnx.json, sau đó tải lên tab Nhập Model ở panel trên.
2. Làm sao để chèn hiệu ứng cảm xúc (cười, hắt xì, thở dài...) vào giọng đọc?
Bạn chỉ cần chèn các thẻ cảm xúc sau vào văn bản khi tạo giọng nói:
- [cuoi]: Kích hoạt tiếng cười.
- [hat_xi]: Kích hoạt tiếng hắt xì.
- [tho_dai]: Kích hoạt tiếng thở dài.
- [ngap]: Kích hoạt tiếng ngáp.
- [vo_tay]: Kích hoạt tiếng vỗ tay.

Ví dụ: "Hôm nay tôi rất vui [cuoi] cảm ơn mọi người đã lắng nghe [vo_tay]."
Mặc định hệ thống sẽ tạo khoảng lặng tự nhiên nếu bạn chưa tải lên âm thanh tùy chỉnh. Bạn có thể tải lên tệp WAV cảm xúc riêng của mình trong tab cấu hình.
3. Tại sao tôi không thể sử dụng các công cụ Huấn luyện hoặc Studio?
Các tính năng liên quan đến huấn luyện và ghi âm yêu cầu mật khẩu xác thực bảo mật để tránh lạm dụng tài nguyên máy chủ. Vui lòng nhập mật khẩu xác thực ở ô khóa tương ứng để mở khóa và trải nghiệm đầy đủ tính năng.
4. Làm thế nào để tải nhiều tệp âm thanh cùng lúc?
Tại tab "Lịch sử", các tệp âm thanh đã tạo được phân loại gọn gàng theo từng ngày. Bạn có thể tích chọn từng tệp mong muốn hoặc nhấn nút "Chọn tất cả ngày" để chọn nhanh toàn bộ tệp trong ngày đó. Khi chọn xong, một thanh thao tác sẽ hiện ra cho phép bạn nhấn "Tải file (.zip)" để tải toàn bộ tệp đã chọn dưới dạng nén ZIP cực kỳ nhanh chóng.