CVNSS4.0 GÓP ĐƯỢC GÌ VÀO XÂY DỰNG CHỮ VIẾT

VÀ BẢO TỒN, PHÁT HUY VĂN HÓA ĐỒNG BÀO DÂN TỘC THIỂU SỐ THỜI CÔNG NGHỆ SỐ?

 

Tác giả: Trần Bình

 

Chữ VN Song Song 4.0 thể góp được vào việc xây dựng chữ viết; bảo tồn, phát huy văn hóa cho các dân tộc thiểu số (DTTS) ở Việt Nam thời công nghệ số?


1. Xây dựng chữ viết cho các DTTS.

 

Theo thống năm 2019, Việt Nam 53 dân tộc anh em, trong đó 32 dân tộc thiểu số (DTTS) đã chữ viết [a], tiêu biểu như: Ê Đê, Ba Na, Hoa, Ho, Tày, Thái, Khmer, Nùng, H'Mông, Gia Rai, Tu, Chăm, Hrê, Mnông, Dao, ...

Gần phân nửa DTTS còn lại thì chưa chữ viết riêng.

 

Từ lâu, chính phủ đã chính sách xây dựng chữ viết cho các DTTS chưa chữ viết.

 

Vấn đề đặt ra hiện nay nên dùng cách âm nào để ghi âm cho chữ DTTS chưa chữ viết? Nên dùng cách âm của Chữ Quốc Ngữ (CQN) hay tạo ra các tự mới đặc biệt để ghi âm cho chữ các DTTS chưa chữ viết?

 

chọn kiểu nào cũng vấn đề riêng của trong thời đại mạng toàn cầu hiện nay.

 

1a. Dùng cách âm của CQN thì vấn đề ?


CQN còn một số hạn chế về âm do ảnh hưởng từ chữ viết các nước của các giáo Tây phương (Ý, Bồ, Pháp) khi sáng tạo CQN. Các hạn chế tiêu biểu về âm như sau:

- Âm /cờ/ khi thì viết C (ca, co…), khi thì K (kín, , ke), khi thì Q (qua, quê…).

- Âm /gờ/ khi thì viết G (ga, …), khi thì GH (ghi, ghê, ghe).

- Âm /ngờ/ khi thì viết NG (nga, ngò…), khi thì NGH (nghi, nghê, nghe).

- Âm /i/ khi thì viết Y (kỳ, …), khi thì I (thi, trí…).

- Chữ “ga, …” thì đọc âm /gờ/, còn chữthì đọc âm /giờ/.

- nhiều dấu phụ. [b]

 

Nay nếu nguyên xi cách âm của CQN để ghi âm cho chữ DTTS thì chữ viết DTTS đó sẽ tiếp tục rắc rối với các dấu, các bất nhất về cách âm như nóitrên. Chưa kể cần phải thêm một phần mềmmáy tính hoặcđiện thoại để ra chữ DTTS dấu vừa mới sáng tạo.

 

1b. Tạo ra các tự mới để ghi âm chữ các DTTS thì vấn đề ?

 

Còn nếu tạo ra các tự mới đặc biệt để ghi âm cho chữ các DTTS thì ngoài việc cần phải thêm một phần mềm để ra chữ DTTS, còn một trở ngại khó khăn khác các tự mới này cần phải đăng số trong bảng Unicode. Nếu không thì các tự mới này sẽ không hiển thị đúng trên mạng toàn cầu (internet) hiện nay, gây khó khăn cho việc quảng trên mạng.

việc đăng số trong bảng Unicode thì phải làm càng sớm càng tốt cũng không dễ dàng.

Nếu đăng trễ quá cho tự mới, các dấu mới lạ đó thì đôi khi tự đó, các dấu mới lạ đó thể nước nào đã đăng dấu đó cho âm nào đó cho tiếng của họ, thì Unicode không thể cấp cho mình nữa, liên quan đến công nghệ nhận diện chữ viết hiện nay, tức đưa văn bản, phần mềm đọc thành tiếng. Nước nào đó đã đăng dùng cái tự nào đó để ghi âm nào đó trong ngôn ngữ của họ, thì mình không thể đăng để ghi cái âm khác trong tiếng của mình.

 

Mới đây, GS.TS. Nguyễn Văn Hiệp (nguyên Viện trưởng Viện Ngôn ngữ học Việt Nam) viết: "Không thể vừa lòng với việc bảo tồn, phát huy theo cách cổ điển, cách cổ điển (xây dựng chữ viết cho người dân tộc, biên soạn từ điển, sách ngữ pháp, tổ chức lớp học tiếng dân tộc...) cũng tốt thôi, nhưng thời đại công nghệ 4.0 đòi hỏi cách tiếp cận khác. Chẳng hạn, trước đây, xây dựng chữ viết cho tiếng dân tộc thiểu số theo tự dạng Latin chỉ đơn giản phân xuất âm vị học cho tiếng dân tộc đó, sau đó dùng mẫu tự Latin để ghi lại các âm, nếu cần thiết thì thêm các dấu phụ. Tuy nhiên, với nguồn Unicode (đang sắp cạn kiệt, phải mở rộng, kiểu điện thoại di động hết số thì phải thêm đầu số) chúng ta phải nhanh tay, làm trước việc đăng các tự của nguồn Unicode (kiểu như xếp gạch giữ chỗ thời bao cấp), sau đó mới thực hiện xây dựng chữ viết, đảm bảo bộ chữ ấy xây dựng xong thể sử dụng trên các nền tảng Unicode." [c]

 

Việc đăng số Unicode các tự mới cho các cộng đồng rất ít người như các DTTS ở Việt Nam thì càng gặp khó khăn nhiều hơn Unicode thường ưu tiên cho các ngôn ngữ nhiều người dùng.

 

Năm 1990, dân số Việt Nam 68 triệu còn gặp khó khăn trong việc đăng số Unicode cho các các tự Chữ Quốc Ngữ.

TS. Ngô Đình Học (Hoa Kỳ), tác giả bộ đa ngữ WinVNKey (winvnkey.sf.net) kể chuyện các khó khăn trong việc đăng số cho các tự Chữ Quốc Ngữ vào những năm 1987-1992 khi Unicode mới thành lập, như sau:

"Vào thời điểm đó tập đoàn Unicode tại thung lũng Silicon đang bắt đầu thiết kế bảng Unicode 16 bit cho toàn thế giới. Tập đoàn này gồm những công ty hàng đầu thế giới về công nghiệp vi tính như IBM, Sun, HP, Apple, Microsoft, v.v. Trong giai đoạn đó, tập đoàn Unicode chủ trương bảng Unicode 16 bit chỉ hỗ trợ 2 bytes cho mỗi tự. thế, bảng này chỉ 65536 số thôi. Do phải để dành số để hóa tất cả các ngôn ngữ cổ cũng như kim trên toàn thế giới, tập đoàn Unicode tìm cách bỏ bớt những mẫu tự thể được tạo thành từ những tự khác. Chẳng hạn, họ chỉ cần hóa một dấu hỏi rời thì không cần cung cấp số riêng cho chữ chữ này thể được tạo thành từ chữ a dấu hỏi rời. Bằng cách này, họ thể bỏ qua tất cả 24 mẫu tự Việt Nam dấu hỏi (12 chữ thường ả, ẳ, ẩ, ẻ, ể, ỉ, ỏ, ổ, ở, ủ, ử, ỷ, 12 chữ hoa tương ứng). Họ đã dùng cách này để loại bỏ 90 mẫu tự Việt cả thường lẫn hoa. Trong khi đó thì họ cung cấp số cho từng chữ một đối với các mẫu tự Pháp, Đức, v.v... Đó một sự thiên vị bất công thiệt thòi rất lớn cho Việt Nam.

Chúng tôi, một nhóm chuyên viên ở Hoa Kỳ, đã nhận thức sai lầm này sẽ tác hại sâu xa đến việc phát triển phần mềm chữ Việt muôn đời về sau nên đã trực tiếp liên lạc làm việc với họ trong các cuộc họp định kỳ nhằm phản đối chủ trương hóa chữ Việt dùng dấu rời (decomposed). Nhưng tiếng nói lẻ tẻ của từng nhân không hiệu quả. Tập đoàn Unicode khăng khăng từ chối, viện ra rất nhiều do, trong đó do Việt Nam chưa hề một bảng chữ Việt chính thứccấp nhà nước nên không cần phải bảo đảm tính tương thích như các bảng Âu châu.

Do đó, chúng tôi bàn bạc với nhau nhu cầu cần hình thành một nhóm thiết kế tiêu chuẩn tiếng Việt để thể bút chiến với họ trong các mailing list tranh luận với họ trong các cuộc họpthung lũng Silicon. Đó do nhóm Vietnamese Standardization Working Group, gọi tắt Viet-Std, ra đời vào mùa thu năm 1989.

Đã cách nói chuyện với tập đoàn Unicode, nhưng lại không một bảng chữ Việt nào đầy đủ chữ Việt để thể đưa ra cho họ xem trong quá trình bút chiến tranh luận, nên chúng tôi phải tiến hành thiết kế một bảng 8 bit đầy đủ chữ Việt thường cũng như hoa. Bảng mới này tên gọi VISCII (VIetnamese Standard Code for Information Interchange). Đồng thời, chúng tôi cũng tiêu chuẩn hóa qui ước viết chữ Việt bằng các tự ASCII thường được dùng trong email Internet (thí dụ: to^i ye^u tie^'ng Vie^.t). Tiêu chuẩn này còn được gọi nôm na bảng 7 bit tiếng Việt, tên chính thức VIQR (VIetnamese Quoted-Readable Specification). Cả hai tiêu chuẩn này được phát hành trong một tập san điện tử song ngữ năm 1992 (http://vietstd.sourceforge.net/report/rep92.htm) trở thành chuẩn RFC1456 nộp lên ủy ban quốc tế đặc trách về tiêu chuẩn mạng Internet năm 1993.

Cuối cùng, nỗ lực vận động của chúng tôi thành công rực rỡ, tập đoàn Unicode chịu lùi bước chấp nhận cung cấp số riêng rẻ (tức số dựng sẵn - precomposed) cho tất cả mẫu tự Việt vào năm 1993." [d]

 

1c. Làm sao giải quyết vấn đề?

 

Như trình bàytrên, dùng cách âm của CQN hoặc tạo ra các tự mới để ghi âm cho chữ các DTTS chưa chữ viết đều vấn đề riêng của trong thời mạng toàn cầu. Vậy làm sao giải quyết vấn đề?

 

Thiết nghĩ, nếu dùng cách âm của Chữ VN Song Song 4.0 (CVNSS4.0) để âm cho chữ của các DTTS thì chữ sẽ không dấu, ngắn gọn tiện lợi cho việc không cần phần mềm để ; cũng không trở ngại cho việc hiển thị trên mạng.

Đó do CVNSS4.0 kiểu chữ không dấu rất ngắn cho tiếng Việt, chỉ sử dụng 26 chữ cái La-tinh như tiếng Anh-Mỹ. rút gọn tối đa CQN qua một số quy tắc rồi dùng chữ cái để thay thế dấu thanh dấu phụ.

 

Giả sử bạn được giao nhiệm vụ sáng tạo một bộ chữ viết cho một bộ lạc DTTS chưa chữ viết.

dụbộ lạc đó, âm "phưởng khọeng" đồng hồ”. Thay dùng cách ghi âm của CQN "phưởng khọeng" thì ta thể dùng cách âm của CVNSS4.0 "fuzv kezr". sẽ gọn hơn không dấu phụ như ở CQN.

 

CQN ghi được bao nhiêu âm tiết tiếng Việt thì CVNSS4.0 cũng ghi được bấy nhiêu âm tiết tiếng Việt.

Theo thống , CQN CVNSS4.0 thể âm được trên 25 nghìn âm tiết nghĩa hoặc không nghĩa trong tiếng Việt.

Với khả năng rất cao này, CQN CVNSS4.0 thể âm hầu hết âm tiết nghĩa hoặc không nghĩa trong các tiếng nói của các DTTS.

(Xin xem công thức CVNSS4.0 danh sách hơn 25 nghìn âm tiết tiếng Việt ghi bằng CVNSS4.0 CQN ở cuối bài này.)

 

Ngày nay, nhiều người DTTS biết đọc viết thành thạo CQN. Nếu họ học thêm các quy tắc tốc CVNSS4.0 thì chính họ cũng thể tự xây dựng bộ chữ không dấu cho tiếng nói của họ, chứ họ không cần phải đợi dân tộc Kinh xây dựng chữ viết cho các cộng đồng DTTS.

Nếu chính người DTTS xây dựng chữ viết cho tiếng nói của họ theo cách âm của CVNSS4.0 thì chắc chắn bộ chữ đó sẽ không những hạn chế không đáng nhưChữ Quốc Ngữ hiện nay.

 

2. Bảo tồn văn hóa cho các DTTS

 

Tại các bảo tàng, thư viện cổ hay các trung tâm văn hóa lịch sử, người ta cần lưu trữ rất nhiều tài liệu, hồi , bản thảo…; các tài liệu này rất dễ bị mối mọt theo thời gian. Quá trình lưu trữ cần rất nhiều thời gian, công sức. Việc sắp xếp, lưu trữ hoặc tìm kiếm thủ công - với lượng văn bản giấy khổng lồ - cùng vất vả tốn nhiều nhân lực thực hiện. Tuy nhiên, mạng toàn cầu Unicode ra đời đã giúp giải quyết bài toán đó một cách đơn giản hơn thông qua việc chuyển đổi ngôn ngữ theo một quy chuẩn nhất định. Các văn bản, tài liệu quan trọng được chuyển đổi từ dạng giấy sang file mềm. giúp việc lưu trữ bảo tồn nhiều di sản văn học/văn hóa của các dân tộc trở nên dễ dàng hơn.

 

Trong số các bộ chữ của 32 dân tộc đã chữ viết thì cũng nhiều bộ chữ các tự chưa đăng số Unicode, chưa font chữ Unicode chưa phần mềm trên máy tính.

không chữ viết hoặc chữ viết đã nhưng chưa đăng số Unicode, chưa font chữ Unicode thì rất khó để bảo tồn văn hóa ngôn ngữ đó không quảng được trên mạng toàn cầu internet.

 

CVNSS4.0 thể giúp giải quyết các vấn đề này bộ chữ tốc CVNSS4.0 chỉ 26 chữ cái La-tinh, không cần phải đăng số Unicode.

 

Với các DTTS chưa chữ viết thì ta thể xây dựng chữ viết theo cách âm CVNSS4.0.

 

Còn với các DTTS đã chữ viết lâu đời nhưng chưa đăng số Unicode thì ta vẫn ghi lại tiếng nói chữ viết đó theo cách âm CVNSS4.0 rồi dùng cách âm mới này song song với chữ viết đã lâu đời.

 

Lưu trữ quảng chữ viết các DTTS trên mạng toàn cầu internet thông qua cách âm không dấu thì rất dễ dàng hữu hiệu.

 

Như đã nóitrên, CQN CVNSS4.0 thể âm được trên 25 nghìn âm tiết nghĩa hoặc không nghĩa trong tiếng Việt. Với khả năng cao này, CQN CVNSS4.0 thể âm hầu hết âm tiết nghĩa hoặc không nghĩa trong các tiếng nói của các DTTS.

 

Sau đây, Danh sách toàn bộ 25.233 âm tiết tiếng Việt ghi bằng CVNSS4.0 CQN để độc giả sử dụng.Sau đây, Danh sách toàn bộ 25.233 âm tiết tiếng Việt ghi bằng CVNSS4.0 CQN để độc giả sử dụng.

- https://chuvietnhanh.sourceforge.net/ToanBo25233AmTietTiengVietGhiBangCVNSSvaCQN.txt

Hoặc:

- https://chuvietnhanh.sourceforge.net/ToanBo25233AmTietTiengVietGhiBangCVNSSvaCQN.xlsx

 

3. Kết luận

 

Với những khó khăn hướng giải quyết nêu trên, ta thấy CVNSS4.0 4.0 thể tạo ra chữ viết cho ngôn ngữ của các DTTS, nhằm hạn chế tạo ra font chữ mới bộ mới.

 

Những ai quan tâm đến vấn đề này muốn tìm hiểu thêm về công thức mục đích của CVNSS4.0 thì thể tham khảo giáo trìnhChữ VN Song Song 4.0” ở: http://chuvietnhanh.sourceforge.net/ChuVNSongSong.htm  

 

nhiên, vấn đề này nếu sự phối hợp giữa các nhà ngôn ngữ học chuyên gia xử ngôn ngữ tự nhiên (natural language processing – NLP) thì sẽ được giải quyết nhanh chóng hoàn hảo hơn.

 

Tác giả: Trần Bình

 

--------------------

Tham khảo

 

[a] Tài liệuKết quả điều tra thu thập thông tin về thực trạng kinh tế - hội của 53 dân tộc thiểu số năm 2019” (của NXB Thống , trang 78)

01-Bao-cao-53-dan-toc-thieu-so-2019_ban-in.pdf (gso.gov.vn)

 

[b] Sách Vấn đề cải tiến chữ Quốc ngữ,” Nxb. Văn Hóa, Hà Nội, 1961,

 

[c] BàiViệc sử dụng tiếng nói, chữ viết của đồng bào dân tộc thiểu số không thể đứng ngoài cuộc cách mạng công nghệ 4.0” của GS.TS. Nguyễn Văn Hiệp (nguyên Viện trưởng Viện Ngôn ngữ học Việt Nam)

https://www.facebook.com/permalink.php?story_fbid=pfbid0fq5WNY4H6xT1Nog2e5W3jwJmL5qqpkCnwKqRRr1eQBKKhK46H3tmYMKZBpZx5wyZl&id=100024257933167

 

[d] Bài Phỏng vấn Ts. Ngô Đình Học về WinVNKey Chữ Việt Nhanh”, nhà báo Nguyễn Hữu Thiện thực hiện.

https://chuvietnhanh.sourceforge.net/PhongVanNgoDinhHocVeWinvnkeyVaChuVietNhanh.htm

 

Tác giả Trần Bình:

 

 

Sinh năm 1954 tại Đà Nẵng, Việt Nam.

Chỗhiện tại: Thành phố Sydney, Úc.

Học vấn: Tốt nghiệp Đại học Tổng hợp Tp.HCM, 1977, ngành Ngữ Văn. Tốt nghiệp Cao đẳng phạm Tiểu Học Đà Nẵng, 1974.

Công việc ở VN: Giáo viên Văn trường THPT cấp 3 Lý Thường Kiệt, Tp.HCM, từ 1977-1980.

Công việcÚc: Làm việcBưu Điện Úc, từ 1982 đến nay (2023). Cuối tuần, dạy Việt ngữ ở Liên trường Văn hóa VN Sydney, từ 1986 đến 2016. Quản trị trang mạng Chữ Việt Nhanh http://chuvietnhanh.sf.net

 

© Trần Bình (phiên bản ngày 15-06-2023)

Email: tubinhtran@gmail.com, Facebook: https://facebook.com/tubinhtran

 

 

Về Trang Chính: Chữ Việt Nhanh

http://chuvietnhanh.sourceforge.net