Ngôn tình audio đã đổi cách Việt Nam đọc

Một kênh YouTube với 72 triệu lượt xem. Một thế hệ độc giả Việt không còn đọc ngôn tình — họ nghe. Cuộc dịch chuyển âm thanh đang viết lại thể loại.

Phan Quỳnh Như · 10 phút đọc ·
Ngôn tình audio đã đổi cách Việt Nam đọc — Xu hướng

Khoảng năm 2024, dữ liệu nghe nói của một kênh YouTube tiếng Việt — không nổi tiếng ngoài cộng đồng độc giả ngôn tình — bắt đầu vẽ đường thẳng đi lên. Kênh đó tên là Nghe Audio Truyện Ngôn Tình. Không chiến lược marketing rõ ràng, không liên kết nhà xuất bản, không host danh tiếng. Một MC tên Hạ Vũ đọc tiểu thuyết tổng tài bá đạo và cô-vợ-sếp-tổng-đòi-ly-hôn lên kênh mỗi tối. Tính đến tháng tám 2025, kênh có 331 nghìn người đăng ký và 72,79 triệu lượt xem trên 965 video.

Đó không phải con số bùng nổ. Đó là con số trung bình — của một thể loại nội dung Việt Nam mà ngành xuất bản truyền thống không còn theo dõi sát.

Bên cạnh kênh đó còn có AUDIO Truyện Hay Official, Truyện Ngôn Tình Hay 3s Official, AUDIO Full VN, và hàng chục kênh nhỏ hơn. Mỗi kênh có MC riêng. MC Vy Vy. MC Nhím Xù. MC QuQu. MC Thu Hà.

Mỗi cái tên là một thương hiệu nghe đọc, không phải thương hiệu xuất bản.

Cuộc dịch chuyển âm thanh của ngôn tình Việt không bắt đầu từ TikTok hay từ một làn sóng startup audiobook. Nó bắt đầu từ một thói quen radio cũ — chương trình «Đọc truyện đêm khuya» của VOV — đã được tái khám phá bởi một thế hệ độc giả vốn không nghe radio nữa. Họ không gọi đó là audiobook. Họ gọi đó là nghe truyện. Trong vòng năm năm, họ đã làm cho cách Việt Nam tiêu thụ ngôn tình thay đổi căn bản.

Theo Statista, thị trường audiobook chính thức của Việt Nam dự kiến tăng trưởng kép 10,42% mỗi năm từ 2024 đến 2029, đạt 23,10 triệu USD vào năm 2029. Bên cạnh con số chính thức đó là cả một nền kinh tế YouTube ad-supported không nằm trong bất kỳ báo cáo thị trường nào — nơi phần lớn người Việt thực sự nghe ngôn tình.

Từ «Đọc truyện đêm khuya» đến thuật toán YouTube

Người Việt nghe ngôn tình trước khi YouTube tồn tại. Chương trình «Đọc truyện đêm khuya» của VOV đã phát sóng nhiều thập kỷ — một giọng đọc chậm, có nhạc nền, đọc các truyện ngắn hoặc tiểu thuyết tâm lý-xã hội cho người nghe khuya. Thói quen nghe-trước-khi-ngủ là một phần cấu trúc của đời sống thông tin Việt Nam, không phải xu hướng mới.

Cái mới là gì?

Cái mới là phiên bản YouTube không phải phát thanh. Nó là xuất bản giả-loạt-phim.

Một kênh chọn một tiểu thuyết — thường là ngôn tình đã đăng trên Truyenfull hoặc Wattpad VN — và phát từng tập, thường vào 7 giờ tối, mỗi đêm. Người xem để lại bình luận. MC trả lời.

Một số kênh chèn lời giới thiệu trước mỗi tập: vài câu trò chuyện cá nhân, một câu chào, đôi khi một câu hỏi gửi đến người nghe trong phần bình luận. Phát thanh không làm điều đó. Phát thanh đẩy nội dung ra. YouTube kéo người nghe vào.

Hệ quả căn bản: MC trở thành nhân vật. Trong chương trình radio cũ, giọng đọc là cơ sở hạ tầng — vô danh, có thể hoán đổi. Trong nền sinh thái YouTube hiện nay, MC là điểm tựa thương hiệu của kênh. Người nghe chọn MC trước khi chọn truyện. «Tôi nghe MC Vy Vy đọc gì» trở thành câu hỏi thường gặp hơn «Truyện X có ai đọc audio không».

MC không thay thế tác giả — nhưng MC quyết định liệu tác giả có được nghe.

Nền kinh tế MC

Một kênh ngôn tình audio Việt thường có cấu trúc đơn giản: một hoặc hai MC chính, một danh sách truyện đã được nhà kênh chọn lọc, lịch phát hằng tuần, và phần kiếm tiền chủ yếu từ quảng cáo YouTube. Một số kênh có cộng đồng Facebook đi kèm.

Cái mà nền kinh tế đó tạo ra là một tầng trung gian mới giữa tác giả và độc giả: người chọn lọc giọng.

Tác giả ngôn tình Trung viết bằng tiếng Trung. Người dịch chuyển ngữ sang tiếng Việt — phần lớn là fan-translator, đăng lên Truyenfull. Kênh YouTube chọn truyện đã được dịch. MC đọc truyện đó.

Người nghe quyết định truyện hay-không-hay phần lớn qua MC. Nếu MC đọc tốt, truyện trung bình thành truyện hay. Nếu MC đọc dở, truyện hay thành truyện không đáng nghe.

Trong cấu trúc đó, tác giả gốc là khâu xa nhất khỏi người tiêu thụ cuối. Người dịch là khâu thứ hai. MC — không phải nhà xuất bản, không phải BookTok influencer, không phải nhà phê bình — là người gần nhất với độc giả. Họ giữ vai trò biên tập của một công đoạn mà ngành xuất bản không trả lương cho ai.

Tại sao audio ngôn tình Việt khác audiobook phương Tây

Mô hình audiobook Mỹ và Anh được xây dựng quanh đi lại. Người Mỹ trung bình nghe audiobook trong xe hơi — hàng ngày, đi làm và về. Audible thiết kế danh mục quanh nhịp đó: sách dài, được chia tập 30-45 phút, được tiêu thụ trong khi tay đang đặt trên vô-lăng.

Việt Nam không có nhịp đó.

Việt Nam có xe máy. Theo phân tích về podcasting Việt Nam của Podnews, văn hoá xe máy và nhịp giao thông khiến việc nghe nội dung dài trong khi lái trở nên không an toàn và không thực tế. Audio không thể chia sẻ thời gian thông cấp với người lái xe máy theo cùng cách nó chia với người lái ô tô.

Hệ quả: audio ngôn tình ở Việt Nam là một trải nghiệm ở nhà, không phải trong xe. Người nghe nằm trên giường, ngồi trong bếp, vừa cho con bú, vừa ủi quần áo. Khi nghe vào 7 giờ tối — giờ phát phổ biến nhất của các kênh lớn — họ đang ăn cơm hoặc đang dọn dẹp. Khi nghe vào 11 giờ đêm, họ đang chuẩn bị ngủ.

Cái đó định hình thể loại được nghe. Truyện cần kịch tính ngắn-mạnh-trong-mỗi-tập (để giữ người nghe ngày mai quay lại). Truyện cần đối thoại nhiều (vì độc thoại nội tâm dài đọc thành tiếng dễ rời rạc). Truyện cần một MC có thể giả giọng đàn ông tổng tài lạnh lùng và giọng cô vợ ngọt ngào trong cùng đoạn — một kỹ năng diễn xuất, không phải đọc.

Cái còn lại sau bản đọc thành tiếng

Khi một tiểu thuyết ngôn tình được đọc thành tiếng, không phải mọi thứ trong văn bản đều sống sót.

Tổng tài bá đạo sống sót tốt. Đây là một thể loại được xây dựng quanh đối thoại sắc — câu nói lạnh lùng, lệnh ngắn, đoạn tranh cãi giữa hai nhân vật chính. MC đọc tốt có thể đẩy nhịp lên với tổng tài bá đạo. Hệ thống cảm xúc của thể loại — quyền lực mất cân bằng, tranh giành kiểm soát, hoà giải qua bạo lực ngôn ngữ — chuyển thẳng từ trang sang tiếng.

Cung đấu sống sót khác. Cung đấu là một thể loại có nhiều nhân vật, mỗi nhân vật có lưu lượng âm mưu riêng. MC một mình phải phân biệt tám phi tần qua giọng nói. Một số MC làm được. Phần lớn không. Cung đấu trên YouTube thường chỉ thành công ở các kênh có MC chuyên giả giọng — một nhánh hẹp hơn của thị trường.

Trọng sinh khó hơn. Trọng sinh phụ thuộc vào sự ngoái nhìn của nhân vật chính — «kiếp này tôi đã biết...». Đây là độc thoại nội tâm nặng. Đọc thành tiếng, độc thoại nội tâm dài cảm thấy như giảng giải. MC giỏi xử lý điều đó bằng cách hạ giọng, kéo dài nhịp. Nhưng vẫn — một số tiểu thuyết trọng sinh tốt nhất trên Truyenfull không bao giờ tìm được kênh audio thành công.

Slow-burn còn khó hơn nữa. Một cảnh tình cảm mà sức nặng nằm trong một câu được cắt từng chữ — «cô ấy không nhìn anh, nhưng anh biết cô ấy đang nhìn» — câu đó được đọc thành tiếng dễ trượt qua tai. Cảnh chậm dày sống trên trang, không trên loa.

Cái còn lại sau bản đọc thành tiếng là điều thực sự đang được tiêu thụ.

Một giả thuyết đáng theo dõi: các tác giả ngôn tình Việt-bản-địa có thể đang bắt đầu viết với nhịp audio trong đầu — câu ngắn hơn, đối thoại nhiều hơn, độc thoại được giới hạn.

Đó chưa phải bằng chứng; đó là dự đoán hợp lý. Nếu kênh audio thực sự định hình thị trường như mô hình này gợi ý, hình dạng câu sẽ thay đổi để phù hợp với cách câu được nghe.

Kinh tế: YouTube miễn phí so với Truyenfull và Waka

Có hai tầng kinh tế của audio ngôn tình Việt.

Tầng thứ nhất là YouTube — miễn phí cho người nghe, quảng cáo trước và giữa các đoạn, kênh kiếm tiền theo lượt xem. Đây là tầng đại chúng — nơi phần lớn tiêu thụ thực sự xảy ra.

Tác giả gốc không nhận gì. Người dịch không nhận gì. MC nhận tiền YouTube. Kênh nhận tiền YouTube. Tác giả là người duy nhất tạo ra giá trị mà không được trả tiền trong chuỗi đó.

Tầng thứ hai là ứng dụng có phí — TF (Truyenfull) có gói audio, Waka có thư viện hơn 20.000 nội dung với cả văn bản và audio, Voiz FM và Fonos chuyên audiobook chính thống. Đây là tầng dành cho người dùng sẵn sàng trả tiền cho chất lượng cao, lưu trữ ngoại tuyến, không quảng cáo. Theo Statista, đây là tầng được đo lường — và nó đang tăng 10,42% mỗi năm.

Nhưng tầng đo lường không phải tầng phổ biến. Tầng phổ biến là tầng miễn phí. Và tầng miễn phí không được tính trong báo cáo thị trường.

Cuộc tranh luận về việc liệu các kênh YouTube đọc truyện đăng trên Truyenfull có vi phạm bản quyền của tác giả Trung Quốc gốc hay không là một cuộc tranh luận mà không ai đứng ra giải quyết. Nhà xuất bản Trung không có cơ chế thực thi tại Việt Nam đối với fan-translation. Tác giả Trung không kiện. Người Việt nghe miễn phí. Hệ thống vận hành như chưa từng có vấn đề bản quyền.

Người được nghe và người được nhớ

Hệ quả văn hoá của cuộc dịch chuyển này lớn hơn dữ liệu thị trường.

Khi một thế hệ độc giả Việt tiếp xúc với ngôn tình chủ yếu qua tiếng, không qua chữ, ký ức về tác phẩm cũng khác. Họ nhớ giọng MC. Họ nhớ cách MC giả giọng tổng tài. Họ nhớ bản nhạc nền của kênh. Câu chữ gốc của tác giả trở thành lớp thứ hai — quan trọng nhưng không phải điều đầu tiên hiện lên trong đầu khi nhắc lại tác phẩm.

So sánh với cách BookTok phương Tây hoạt động — nơi người đọc nhớ bìa sách, nhớ tên tác giả, nhớ một câu trích — cách độc giả Việt nhớ ngôn tình audio là một mô hình ký ức khác. Hệ quả: khi một độc giả Việt giới thiệu một tiểu thuyết ngôn tình kinh điển cho bạn, họ thường giới thiệu kênh trước, tác phẩm sau. «Nghe kênh Hạ Vũ đọc, có cuốn này hay» là cấu trúc câu phổ biến hơn «Đọc cuốn X của tác giả Y».

Đối với ngành xuất bản truyền thống Việt Nam — các nhà xuất bản đang đầu tư vào ngôn tình bản địa, các đại diện tác giả mới đang xây dựng nghề nghiệp viết — sự dịch chuyển này có ý nghĩa thực tế. Nếu kênh là điểm tựa thương hiệu, không phải tác giả, thì giá trị tác quyền dài hạn của một nhà văn ngôn tình Việt phụ thuộc vào việc kênh có chọn họ hay không. Nhà văn không có hợp đồng với kênh. Kênh chọn tự do. Không có cơ chế thị trường ổn định giữa hai phía.

Cái sẽ ở lại

Cuộc dịch chuyển âm thanh không phải là một thí nghiệm. Nó là cấu trúc tiêu thụ mới của thể loại lãng mạn phổ biến nhất Việt Nam. 72,79 triệu lượt xem của một kênh — và đó vẫn chưa phải kênh lớn nhất — không phải là điều có thể đảo ngược.

Điều có thể thay đổi là ai được trả tiền, ai được nhớ, và thể loại sẽ tự viết lại bằng những hình dạng câu phù hợp với việc được nghe thay vì được đọc.

Tác giả ngôn tình Việt sẽ thích nghi hoặc bị bỏ lại. MC sẽ trở thành người gác cổng. Nhà xuất bản truyền thống sẽ phải hợp tác với kênh, không phải cạnh tranh với chúng. Và «Đọc truyện đêm khuya» — chương trình radio cũ đã sinh ra thói quen này từ nhiều thập kỷ trước — sẽ là vật phẩm bảo tàng của một nền văn hoá nghe mà người Việt đã chính thức kế thừa, mở rộng, và làm thành thị trường.

Đến năm 2029, theo dữ liệu Statista, thị trường audiobook chính thức của Việt Nam sẽ đạt 23,10 triệu USD. Tầng YouTube không được đo — tầng nơi đa số người Việt thực sự nghe ngôn tình — có lẽ sẽ lớn hơn nhiều.

P
Tác giả:
Phan Quỳnh Như
Phan Quỳnh Như viết về sự dịch chuyển văn hoá đọc của Việt Nam. Theo dõi nền sinh thái xuất bản nội địa và đời sống đọc của thế hệ Z.