19 BÀI VỀ CHỮ VIỆT THỜI CÔNG NGHỆ SỐ

Tác giả: Long Ngo

Vài nét về Thạc Ngô Hoàng Đại Long (Long Ngo)

Hiện Nghiên cứu viên tại Phân hiệu Đại học Quốc gia-TP.HCM tại tỉnh Bến Tre, nhiều công tŕnh khoa họcđược công bố trên Scopus & WoS - liên quan đến hướng nghiên cứu của ḿnh về Địa ngôn ngữ, nhất các Ứng dụng của xử ngôn ngữ tự nhiên trong GIScience.

 

 

1.     Chữ VN Song Song 4.0 (Cvnss4.0)

2.     Cvnss4.0 - Phát triển như thế nào?

3.     sao Cvnss4.0 bị hiểu lầm?

4.     bao nhiêu chữ biến thể từ chữ Việt truyền thống hiện nay?

5.     Kỳ 1. sự bộ tiếng Việt - Sự xuất hiện của “VIQR”

6.     Kỳ 2. sự bộ tiếng Việt - Đi t́m một tiêu chuẩn thống nhất (?)

7.     Cvnss4.0 trong bối cảnh cách mạng công nghệ 4.0

8.     Cvnss4.0 về mặt ngôn ngữ

9.     Cvnss4.0 - Thuộc nhóm các ngôn ngữ IAL?

10. Chữ Quốc Ngữ trong tiến tŕnh lịch sử dân tộc

11. Cvnss4.0 trong hành tŕnh t́m tiếng nói đồng thuận

12. Tiện ích nhỏ từ Cvnss4.0 mang lại

13. Cvnss4.0 dưới góc nh́n hóa

14. Những chữ cái dùnglậu

15. điệu của những con chữ

16. Cvnss4.0 từphát kiếnđến sự h́nh thành giả thuyết cho bộ chữ Bila

17. Giá trị tiếng Việt qua các minh chứng. Thêm góc nh́n từ Cvnss4.0

18. Chữ Việt cổ qua lăng kính Cvnss4.0

19. Mạn đàm về thanh điệu trong tiếng Việt từ quá khứ đến tương lai

 

Giới thiệu: Từ ngày 14-8-2022 đến ngày 13-5-2023, Thạc Long Ngo đăng trên Phây búc (Facebook) ở nhómTôi Yêu Chữ Việt 4.0” một loạt hơn 20 bài ngắn dài liên quan đến chữ Việt thời công nghệ số, như về: Chữ Quốc Ngữ, bộ tiếng Việt, Chữ VN Song Song 4.0, v.v

Sau đây 19 bài trong loạt bài trên.

 

BÀI 1: CHỮ VN SONG SONG 4.0

(ngày 14-8-2022)

Tôi vài chia sẻ về chữ VN Song Song 4.0 (Cvnss4.0) dưới góc nh́n nhân công việc của ḿnh. Hy vọng quư ACE thể phát triển thêm.

1. Cvnss4.0 phải bộ tiếng Việt với các kiểu khác nhau. Hiện Việt Nam hơn 10 bộ tiếng Việt khác nhau. Như vậy, Cvnss4.0 thể sẽ phát triển thành một bộ tiếng Việt hay nói đúng hơn Cvnss4.0 vẫn nhiều lợi thế tính ưu việt trong việc phát triển này. Đơn cử hiện nay, trên các điện thoại thông minh việc chữ dấu rất hạn chế, chưa kể kiểu chữ Xiteen viết sai be bét nhưng vẫn được cộng đồng các bạn trẻ dùng. Liệu lâu dần, mất đi sự giàu đẹp của tiếng Việt không?

Cvnss4.0 ra đời thể sẽ giải quyết bài toán này bởi tính nguyên tắc quy luật đă được thiết lập ngay từ đầu làm sở cho việc xây dựng bộ tiếng Việt tối ưu hơn.

2. Cvnss4.0 thể thay thế cả Morse quốc tế hóa 26 chữ cái tiếng Anh từ A đến Z để giao tiếp đặc biệt dành cho người Việt. Tại sao không chứ? dụ: truyền tải tín hiệu thông qua Cvnss4.0, người phát tín hiệu người nhận tín hiệu sẽ dễ dàng hiểu được câu nói ấy bởi âm thanh phát ra từ định ước Cvnss4.0 dựa trên Morse. Trong một số ngành, lĩnh vực nhất định việc truyền tín dựa trênchữ dấusẽ tốn kém mất thời gian.

3.Chữ Braille được du nhập vào nước ta được Việt hóa từ năm 1898. Chữ Braille được biểu diễn trong một ô h́nh chữ nhật đặt đứng gồm các chấm nổi, thể nhận biết khi sờ bằng đầu ngón tay. Nhưng ai từng chứng kiến việc dùng các chữ này khó khăn thế nào khi bỏ dấu chưa? Nếu thông qua Cvnss4.0 th́ việc cải tiếng Chữ Braille cho người khiếm thị tại sao không chứ?

4. Ngôn ngữ lập tŕnh không dựa trên tiếng Anh, tại sao không chứ? Nếu ta dùng Cvnss4.0 cho một ngôn ngữ lập tŕnh th́ cũng đáng tự hào chứ? Ta xem trường hợp của Python từ Hà Lan, Ruby từ Nhật Bản Lua từ Brazil…

Tôi vẫn ủng hộ nhóm tác giả đề cao sự sáng tạo cũng như t́m kiếm các nhân phát triển thêm Cvnss4.0 trên nhiều phương diện khác nhau để Cvnss4.0 trở nên thông dụng. Tôi viết bài này dựa trên nhân quan sát một thời gian dài không dựa trên bất cứ tài trợ nào.

Long Ngo

Nguồn: https://www.facebook.com/groups/toiyeuchuviet4.0/posts/814720146608768/

-------------------

 

BÀI 2: CHỮ VN SONG SONG 4.0 - PHÁT TRIỂN THẾ NÀO?

(ngày 15-8-2022)

Tôi vài ư kiến chia sẻ về chữ VN Song Song 4.0 (Cvnss4.0) dưới góc nh́n nhân thể làm nhóm tác giảkhông vuinhưng hy vọng đó cách giúp cho Cvnss4.0 phát triển thêm:

1. Để am hiểu một chữ viết mới như Cvnss4.0 cần thời gian để mọi người cảm nhận thông qua các giá trị tự thân mang lại, bao gồm:

(i) Công bố quốc tế về Cvnss4.0 trong các bài báo khoa học về ngôn ngữ NLP-Natural Language Processing;

(ii) Thông qua các ứng dụng từ Cvnss4.0 mang lại, cụ thể các ứng dụng IT để mọi người thấy các tính năng của mang lại;

(iii) Cvnss4.0 nên chia ra nhiều nhánh phát triển nâng lên một tầm cao mới. Lư do, nhóm tác giả hiện không thể phát triển nếu thiếu sự chung tay của một nhóm người hoặc một tổ chức về Cvnss4.0. Điều đó, đứa con tinh thần Cvnss4.0, nhóm tác giả phải xa dần để cho (Cvnss4.0) lớn trưởng thành hơn. (tức nghĩa về mặc bản quyền, Cvnss4.0 phải trở thànhngôn ngữ mở” hay nói khác đi chấp nhận trở thành tài sản chung của cả dân tộc Việt Nam.

(iv) Việc chia sẻ thông tin tranh luận từ các group diễn đàn cũng tốt. Nhưng theo tôi không nên tốn nhiều thời gian vào việc tranh luận bổ, chả giải quyết được , càng làm mọi thứ trở nên xấu đi. Thay vào đó, xây dựng lực lượng các team nhỏ với các chuyên môn khác nhau các chuyên ngành khác nhau cùng nhau xây dựng phát triển. sẽ h́nh thành một diễn đàn riêng xài Cvnss4.0 bắt buộc trong diễn đàn ấy.

Góc nh́n của tôi thể chưa đúng nhưng nếu tôi Cvnss4.0 sẽ phát triển theo chiều kích vào các mảng hẹp của ngôn ngữ từ đó nâng cao vị thế của Cvnss4.0. Chưa bao giờ tôi từ bỏ chữ viết tiếng Việt nhưng nếu Cvnss4.0 th́ đó sẽ làm cho công việc tiếng nói them giàu đẹp phong phú hơn.

Long Ngo

Nguồn: https://www.facebook.com/groups/toiyeuchuviet4.0/posts/815146673232782/

-------------------

 

BÀI 3: V̀ SAO CHỮ CVNSS4.0 BỊ HIỂU NHẦM?

(ngày 16-8-2022)

  1. Thay đổi chữ viết Tiếng Việt truyền thống (hiện hữu), mặc nhóm tác giả nhắc đến sẽ sử dụng song song (Cvnss4.0) không ảnh hưởng đến Chữ Quốc Ngữ (chữ tiếng Việt) hiện nay. Tuy nhiên, mọi người vẫn không hiểu hoặc nhóm tác giả chưa giải tính hữu ích của Cvnss4.0 như thế nào?
  2. Mặc , nhóm tác giả đă nhận được giấy chứng nhận bản quyền số 1850/2020/QTG từ Cục Bản quyền tác giả thuộc Bộ Văn hóa, Thể thao Du lịch (VH-TT-DL) cho công tŕnh nghiên cứu chữ viết của ḿnh. Tuy nhiên, việc thiếu đi các công bố khoa học về đă làm cho luận ngờ vực về sự "cải tiến" của Cvnss4.0, thậm chí ngờ vực "cải lùi"
  3. Cvnss4.0 chưa thể biểu hiện được tính biểu âm, biểu tượng chỉ biểu biểu nghĩa. Chính vậy, mọi người sẽ khó chấp nhận nếu tính "biểu âm, biểu tượng" trong chữ viết? Cho nên, người đọc lần đọc tiếp nhận sẽ khó chấp nhận.
  4. Ở Nhật bản các loại chữ tiếng Nhật: Hiragana, Katakana, Kanji Romaji. Tuy nhiên, không phải người Nhật nào cũng rành. Ở Nhật c̣n một kiểu chữ đó Ro-maji này dùng để phiên âm các loại chữ chính trong tiếng Nhật như Kanji, Hiragana, Katakana để giúp người nước ngoai thuận lợi hơn khi học tiếng Nhật. Điều này khá tương tự như Cvnss4.0. Khi các bạn sử dụng bàn phím điện thoại tiếng Nhật cũng nên chọn Japanese- Ro-maji để việc chữ được quen tay giống tiếng Việt hơn. Cvnss4.0 sẽ khó chấp nhận nếu đó người Việt, phải hướng đến đối tượng khác.

Vd: chuyển các chữ dân tộc qua Cvnss4.0 rồi về lại chữ Việt truyền thống. Trường hợp, chữ Khmer (អក្សរខ្មែរ) -> Cvnss4.0 -> chữ Việt.

Rất mong nhóm tác giả những giải pháp phát triển chữ Cvnss4.0 theo cách tiếp cận mới.

Long Ngo

Nguồn: https://www.facebook.com/groups/toiyeuchuviet4.0/posts/815921423155307/

-------------------

 

BÀI 4: CÓ BAO NHIÊU CHỮ BIẾN THỂ TỪ CHỮ VIỆT TRUYỀN THỐNG HIỆN NAY?

(ngày 18-8-2022)

  1. Chữ Việt nhanh (chữ Latinh) (viết tốc );
  2. Chữ VN song song 4.0 (chữ Latinh)
  3. Chữ Việt không dấu (dùng trong tin nhắn)
  4. Chữ Xiteen (chữ Latinh)
  5. Chữ phiên âm tiếng Việt (Nghị định 30/2020/NĐ-CP) (chữ Latinh)
  6. 27 bộ chữ viết phiên âm từ tiếng dân tộc qua tiếng Việt (chữ Latinh).
  7. Chữ Braille (chữ nổi) dành cho người đă Việt hóa.

.....

Chữ Việt bộ chữ viết người Việt dùng để viết ngôn ngữ mẹ đẻ tiếng Việt, từ quá khứ đến hiện tại. Để ghi chép tiếng Việt người Việt đă kết hợp cả chữ Hán với chữ Nôm lại, Chữ Quốc Ngữ (chữ Latinh). hiện nay Chữ Quốc Ngữ trở nên thông dụng phổ biến. Chữ VN song song 4.0 không thể cạnh tranh hay thậm chí thay thế.

Chữ VN song song 4.0 một sự sáng tạo nhưng để chữ này làm đ̣n bẩy tôi thiết nghĩ chúng ta cần hướng đi riêng nhất trong mảng CNTT. thể tôi sai, rất mong quư vị đóng góp thêm.

Long Ngo

Nguồn: https://www.facebook.com/groups/toiyeuchuviet4.0/posts/816997589714357/

-------------------

 

BÀI 5: KỲ 1. KƯ SỰ BỘ GƠ TIẾNG VIỆT - SỰ XUẤT HIỆN CỦA "VIQR"

(ngày 24-8-2022)

Sau năm 1975, một làn sóng người Việt Nam di đến Bắc Mỹ, châu Âu, Hồng Kông, Trung Quốc Úc. Tại Hoa Kỳdân số nhập Việt Nam trước đó chỉ tầm vài ngh́n người đến năm 1980 đă tăng lên thành 245.025 người. Đến năm 1990, con số này tăng gấp đôi thành 593.213 đến năm 2000 đă lên đến 1.122.528. Xa rời đất mẹ chịu sự lề hoá nơi đất khách quê người, những người Việt tha hương luôn khát khao được hàn gắn sợi dây cội nguồn văn hoá bị đứt găy. Tiếng Việt lúc này phương tiện kết nối cụ thể nhất như tác giả Anh Trần đă dẫn chứng trong Giáo dục Ngôn ngữ Việt Nam tại Hoa Kỳ rằng ít năm sau 1975 một sự tăng trưởng đột biến số lượng các trường dạy tiếng Việt ở Hoa Kỳ.

Những nỗ lực duy tŕ kết nối với quê nhà qua ngôn ngữ diễn ra trong thời điểm nhiều tiến bộ công nghệ. Ngành công nghiệp máy tính chuyển dần từ máy tính lớn sang máy vi tính nhân. IBM đă phát hành mẫu máy tính gia đ́nh đầu tiên vào năm 1977 với cái tên Altair 8800. Đến năm 1981, hăng bắt đầu sản xuất hàng loại máy IBM-PC, tương tự với máy tính bàn hiện đại. Máy tính dần dần trở thành một thiết bị ngày một riêng nhân hơn.

Cộng đồng Việt kiều ở Hoa Kỳ được tiếp xúc với những tiến bộ máy tính này khá sớm. Nguyên nhân do vào những năm 1990, số lượng lớn dân nhập người Việt đặc biệt phụ nữ giữ vị trí những kỹ thuật viên cấp ở Thung lũng Silicon, sau này kỹ trong lĩnh vực Công nghệ Thông tin. Người Việt cũng thuộc nhóm những người tiên phong về ngành nàyÚc. Một dụ thể kể đến đó chính các bạn sinh viên tại trường Đại học Quốc gia Úc đă hoàn thành dự án mang kết nối internet đến Việt Nam.

Trong cuốn sách Transnationalizing Vietnam: Community, Culture, and Politics in the Diaspora, Kiều Linh Caroline Valverde nói về lập tŕnh viên máy tính Tín Lê, thành viên của một nhóm các nhà khoa học máy tính người Mỹ gốc Việt chuyên về thiết lập liên kết qua mạng diện rộng. Năm 1986, nhóm này đă kiến tạo một danh sách email lấy tên Vietnet, nhằm kết nối các cộng đồng người Việt hải ngoại thông qua giao tiếp điện tử. Trong một lần phỏng vấn với Kiều Linh Caroline, Tín Lê chia sẻ: “Thật khó để kết nối với nhau, đặc biệt những khu vực ít người Việt trú. Chúng tôi ai cũng mong muốn được làm quen tṛ chuyện cùng nhau.”

Các quản trị viên của Vietnet sau đó đă chuyển danh sách email này đến một nhóm tin Usenet, một diễn đàn thảo luận tên soc.culture.vietnamese (SCV). Danh sách email của Vietnet SCV đều trước internet cả hai đều dựa vào các mạng lưới nhỏtiền thân của mạng lưới toàn cầu. Kho lưu trữ của Google về các cuộc thảo luận nhóm tin cho thấy SCV ra đời từ rất sớmtháng năm 1991. Ta thể t́m thấy mọi thông tin liên quan đến Việt Nam từ thi ca, lời bài hát, công thức nấu ăn, quảng cáo, t́m kiếm người thân, thông báo dự án học tập, cho đến các cuộc thảo luận về các vấn đề lớn hơn trên diễn đàn này.

Máy tính thời kỳ đó chỉ hỗ trợ tiêu chuẩn hóa tự ASCII (viết tắt của tiêu chuẩn Mỹ trong Trao đổi Thông tin). Bộ chỉ thể hiện bảng chữ cái tiếng Anh trên máy tính không bao gồm dấu phụ. Để liên lạc với nhau trong nhóm tin, các thành viên Vietnet SCV đă sử dụng một bộ quy tắc cho phép các thành viên viết tiếng Việt bằng cách sử dụng các tự sẵn trong ASCII để biểu thị dấu phụ của tiếng Việt. Bộ này bao gồm (. + ^? '). Các quy tắc thường được gọi chung quy ước Vietnet, quy ước SCV hoặc quy ước VIQR ( viết tắt của Vietnamese Quoted-Readable). Các quy ước VIQR đă trở thành tiêu chuẩn nhiều công dân trực tuyến Việt Nam trong thời hoàng kim của các nhóm tin diễn đàn tin dùng, vẫn c̣n được nhiều người sử dụng cho đến tận ngày nay.

 

Ảnh chụp lại từ Một bài đăng trên Usenet liệt một số tên tiếng Việt nhưng nghe như những từ mang ư tứ xúc phạm trong tiếng Anh để các bậc phụ huynh lưu tâm khi đặt tên cho con tránh bị người Mỹ chế giễu. Ảnh chụp màn h́nh qua Google Group.

D̉NG CHẢY Ồ ẠT CỦA CÁC GIẢI PHÁP CÔNG NGHỆ

Các quy ước VIQR  tiện lợi nhưng suy cho cùng cũng chỉ một giải pháp tạm thời những người chưa thạo vẫn không đọc được nội dung tiếng Việt này. Nhu cầu thiết lập một chuẩn cho các tự tiếng Việt sử dụng trên các trang web các phông chữ vẫn luôn hiện hữu. thế, vào cuối những năm 1980 đầu những năm 1990, đă rất nhiều phần mềm, bộ hóa tự phông chữ tiếng Việt xâm nhập vào thế giới mạng. một vài giải pháp khá hữu hiệu, thế nhưng phần lớn lại đề ra một nan đề mới. Như Kim An Lieberman giải thích trong Asian America.Net: Ethnicity, Nationalism, and Cyberspace"Vấn đề không phải làm thế nào để đưa tiếng Việt lên internet, sử dụng phiên bản tiếng Việt nào."

Thời gian này xuất hiện một tiêu chuẩn hóa, đồng thời cũng một phương cách nhập liệu phổ biến: tiêu chuẩn VNI. VNI được phát triển bởi ông Hồ Thanh Việt, một kỹ phần mềm người Việt sinh sống tại Westminster. Năm 1987, ông Việt đề xuất sử dụng các phím số để biểu thị dấu phụ. Phương thức nhập liệu này được ông Việt Công ty Phần mềm VNI phổ cập biến thành một sản phẩm dưới dạng một chương tŕnh xử phông chữ văn bản, thiết kế cho hệ điều hành MS-DOS.

Từ đây, VNI trở thành tiêu chuẩn cho in ấn ma trận điểm, giúp cải thiện h́nh thức tŕnh bày của các tờ báo tiếng Việt ở Mỹ. VNI thậm chí c̣n được Microsoft áp dụng vào hệ điều hành Windows 95 vào những năm 1990. Tuy nhiên, VNI Software sau đó đă kiện Microsoft về việc sử dụng trái phép, buộc khổng lồ công nghệ này phải loại xoá bộ này khỏi hệ điều hành của họ. Ngày nay, tiêu chuẩn VNI được dạy trong sách giáo khoa của bộ môn tin học, vẫn được nhiều người sử dụng ở Việt Nam.

Cũng trong khoảng thời gian này Hiệp hội Unicode ra đời. Hiệp hội được thành lập vào năm 1987 tại Thung lũng Silicon với các thành viên làm việc cho nhiều công ty công nghệ như Apple, Xerox, Sun microsystems, IBM Microsoft. Hiệp hội Unicode mong muốn đề ra một tiêu chuẩn chung để hóa hiển thị mọi ngôn ngữ bao gồm cả tiếng Việt. Hiệp hội đă mở rộng tiêu chuẩn 8 bit thông dụng trong việc hóa tự bấy giờ thành bộ tự 16 bit để tăng số lượng tự thể mang chứa.

Đối với tiếng Việt, kế hoạch ban đầu của hiệp hội này để gán cho từng dấu phụ, thay gán cho một tổ hợp sẵn. Lư do Unicode muốn tiết kiệm dung lượng tránh phải hóa những tự thể được tạo ra bằng cách kết các tự đă được gán . Tuy nhiên, trong quá tŕnh thực hiện Unicode lại gặp phải một số vấn đề.

Theo một ghi chú của Tập đoàn phi lợi nhuận Viet-Std thành lập với mục đích chuẩn hóa tiếng Việt trên máy tính, "Việc sử dụng nhiều dấu phụ trong các văn bản tiếng Việt dẫn đến nhu cầu tạo ra một bàn phím nhập liệu không cần thêm phím tắt đặc biệt nào đểsoạncác chữ cái dấu." Tiến Ngô Đ́nh Học, một trong những thành viên của Viet-Std, cho rằng góc nh́n này khá không công bằng bởi lẽ người Pháp người Đức lại được hưởng đặc quyền mọi tự được hóa sẵn trong bộ Unicode.

Tập đoàn Viet-Std đă gửi đơn khiếu nại đến Unicode để xem xét lại việc này nhưng bị từ chối với do ngôn ngữ tiếng Việt không một hệ thống hóa tự thống nhất, do đó, không cần phải đảm bảo khả năng tương thích như các ngôn ngữ gốc La-tinh khác. Không chấp nhận lập luận của Unicode, Tập đoàn Viet-Std đă phát triển tiêu chuẩn hóa tự VISCII ( Tiêu chuẩn của Việt Nam để Trao đổi Thông tin) vào năm 1992. VISCII dựa trên nền tảng của bộ tự ASCII đă được chỉnh đổi, trong đó các tựdễ xử" nhất trong bộ ASCII gốc được thay thế bằng các dấu phụ tiếng Việt.

Măi đến năm 1993 Unicode mới đồng ư hóa mọi tự thuộc tiếng Việt. Từ đó trở đi, nhiều quy ước đánh máy hơn đă xâm nhập vào thế giới mạng. Vào năm 1993, tổ chức phi lợi nhuận Vietnam Professionals Society (VPS) phát hành phần mềm phương thức nhập liệu VPSKey của riêng ḿnh, thiết kế cho hệ điều hành Windows 3.1. Cũng trong năm đó, Bộ Khoa học, Công nghệ Môi trường của Việt Nam (nay Bộ Khoa học Công nghệđă ban hành TCVN 5712 – một tiêu chuẩn hoá tự 8-bit toàn quốc cho tiếng Việt. hóa tự TCVN 5712 được gọi VSCII ( Trao đổi Thông tin Tiêu chuẩn của Việt Nam) bao gồm ba phiên bản: VN1, VN2 VN3. Bộ đầu tiên bộ ASCII đă được điều chỉnh, hai bộ c̣n lại sử dụng ASCII mở rộng. TCVN 5712 khi đó được sử dụng rộng răimiền bắc nước ta.

Các trang web cuối cùng cũng thể hiển thị đúng tiếng Việt người dùng thể viết tiếng Việt trên web nếu đầu ra đầu vào tương thích với nhau.

Tuy nhiênviệc đọc tiếng Việt trên máy tính vẫn một vấn đề đau đầu do quá nhiều giải phápvới mỗi giải pháp cho phép từng trang web sử dụng bảng phông chữ không tương thích với nhau. Do đó, những người dùng không được trang bị các công cụ phù hợp vẫn không thể đọc viết tiếng Việt một cách dễ dàng.

(Xem tiếp kỳ 2). KỲ 2. KƯ SỰ BỘ GƠ TIẾNG VIỆT - ĐI T̀M MỘT TIÊU CHUẨN THỐNG NHẤT (?)

Long Ngo

Nguồn: https://www.facebook.com/groups/toiyeuchuviet4.0/posts/821130762634373/

-------------------

 

BÀI 6: KỲ 2. KƯ SỰ BỘ GƠ TIẾNG VIỆT - ĐI T̀M MỘT TIÊU CHUẨN THỐNG NHẤT (?)

(ngày 25-8-2022)

Nhiều phần mềm bộ xử văn bản vẫn tiếp tục sử dụng hóa tự tiếng Việt 7 bit 8 bit trước khi Microsoft Windows đưa hóa Unicode cho tiếng Việt vào phiên bản 2000.

WinVNkey chương tŕnh máy tính đầu tiên cho phép người dùng tiếng Việt trên Windows 3.0 – phiên bản đầu tiên của hệ điều hành Windows sau MS-DOS. TriChlormột nhóm phi lợi nhuận ủng hộ việc lấy VISCII làm tiêu chuẩn sử dụng thống nhất, đă thiết kế cung cấp WinVNKey miễn phí cho người dùng. Vào năm 2000, khi nhận ra tiềm năng phát triển của Unicode, WinVNkey bắt đầu hỗ trợ tiêu chuẩn hoá này.

Về sau tác giả Ngô Đ́nh Học, khi ấy đang làm việc với Unicode thiết kế tŕnh điều khiển bàn phím tiếng Việt cho Macintosh ( một ḍng sản phẩm máy tính nhân được thiết kế, phát triển, đưa ra thị trường bởi Apple Inc), đă tiếp quản dự án này. Chương tŕnh này trở thành một phần mềm cho phép nhập liệu đa ngữ kênh dẫn cho hơn 30 ngôn ngữ quốc tế cũng từng gặp phải khúc mắc khi đưa vào máy tính. Chương tŕnh cũng hỗ trợ tự chữ Nôm ngôn ngữ dân tộc thiểu số Việt Nam.

Ngang tài ngang sức với WinVNKey phải kể đến hệ thống Vietkey khá phổ biến. Vietkey được phát triển vào năm 1991 phát hành vào năm 1997 bởi Vietkey Group, một công ty trụ sở tại Việt Nam thành lập bởi Đặng Minh Tuấn – một kỹ trẻ của Bộ Quốc pḥng thời đó. Ban đầu, Vietkey một phần mềm miễn phí rồi sau đó được thương mại hoá cùng với các sản phẩm khác của công ty. Vietkey hỗ trợ tiếng Việt, tiếng Anh, tiếng Pháp, tiếng Đức tiếng Nga thậm chí c̣n cả một phiên bản tương thích với hệ điều hành Linux. Cũng giống với đội ngũ đằng sau WinVNKey, Đặng Minh Tuấn ủng hộ việc tạo dựng một tiêu chuẩn hóa tự phổ cập để tiếng Việt. Vào năm 1997, Đặng Minh Tuấn Vietkey đề xuất hỗ trợ Unicode, đến năm 2000, họ đă điều chỉnh phần mềm này sao cho chỉn chu hơn. Tuy nhiên, Vietkey vẫn một yếu điểm đối với nhiều người: phần mềm này thu phí.

Phạm Kim Long, lúc bấy giờ vẫn c̣n một sinh viên cao học tại Prague, nhận thấy nhu cầu cho một phần mềm khác thể truy cập rộng răi thể hỗ trợ Unicode ngoài Vietkey. Ông Long đă ư tưởng phát triển phần mềm phương thức nhập liệu của riêng ḿnh, đă cho phát hành Unikey vào năm 2000. Bản rút gọn miễn phí của phần mềm này hiện mặt trên khắp các máy tính ở Việt Nam. Ấp ủ ư tưởng này từ năm 1991 khi ông các bạn cùng lớp tại Đại học Khoa học Công nghệNội thách đố nhau viết một chương tŕnh đánh máy tiếng Việt nhẹ nhất bằng ngôn ngữ Assembly. Ông Long đă chiến thắng với một chương tŕnh chỉ nặng 2 kilobyte được gọi LittleVNKey.

Tuy nhiên, LittleVNKey không hỗ trợ Unicode. Năm 2000, ông bắt tay thiết kế một chương tŕnh nhập tiếng Việt với hỗ trợ Unicode, sau khi xem các thảo luận trực tuyến về việc Windows 2000 thể hỗ trợ nhiều ngôn ngữ trong đó tiếng Việt. Ông đă dành hai ngày để lập tŕnh phát hành trực tuyến phiên bản đầu tiên của Unikey. Sau đó, ông đă dành bốn tháng tiếp theo để nhận phản hồi tinh chỉnh phần mềm của ḿnh. Năm 2006, thông qua một người bạn Việt Kiều, Phạm Kim Long đă đồng ư để Apple quyền tích hợp phần mềm trong hệ điều hành của ḿnh. Unikey vẫn một phần mềm miễn phí c̣n đang hiện hành.

Mặc ông Long ông Tuấn hai người được biết đến nhiều nhất trong hành tŕnh cho tiếng Việt tương thích với máy tính hiện đại, sự phát triển của công nghệ đánh máy đa dạng hơn nhiều phản ánh nhu cầu văn hóa hội lịch sử của một nhóm người khao khát kết nối với thế giới với chính cộng đồng của họ.

Hiện nay đă khá nhiều bộ tiếng việt cho máy tính Windows/Linux để hổ trợ chúng ta dễ dàng mỗi khi cần nhập văn bản bằng Tiếng Việt trên Word, Chat, … Các bộ này được tồn tạicác phiên bản phí miễn phí đôi khi bạn sẽ cảm thấy rất khó khăn trong để thể chọn cho ḿnh bộ ứng dụng phù hợp như:

Tóm lại, bộ tiếng Việt một chương tŕnh máy tính loại phần mềm hỗ trợ soạn thảo văn bản bằng tiếng Việt trên máy tính, thường cần phải font tự Chữ Quốc Ngữ đă được cài đặt trong máy tính. Các bộ tiếng Việt khác nhau sẽ hỗ trợ một hay nhiều bảng kiểu . Mỗi bảng quy định việc thể hiện font chữ khác nhau mỗi kiểu quy định việc viết dấu bằng các tổ hợp phím khác nhau. Mỗi bộ điều ưu nhược khác nhau.

Nếu nh́n nhận dưới góc độ Ergonomics Cvnss4.0 cũng một kiểu hỗ trợ soạn thảo văn bản bằng tiếng Việt nhằm đặt tới sự tối ưu hóa về tốc độ, linh hoạt hơn trên thiết bị Smartphone, tốc hóa khi ghi biên bản. Việc sử dụng Cvnss4.0 không phải để thay thế cho Chữ Quốc Ngữ (chữ Việt truyền thống), tôi nghĩ Cvnss4.0 thêm một giải pháp hữu ích về mặt công nghệ trong cải thiện hoặc hỗ trợ bổ khuyết nhằm tăng tính ưu việt hơn nữa việc biểu đạt tiếng nói của dân tộc Việt trên trường quốc tế.

(Xem tiếp kỳ 3). KỲ 3. CHỮ VN SONG SONG 4.0 (Cvnss4.0) TRONG BỐI CẢNH CUỘC CMCN 4.0

Long Ngo

Nguồn: https://www.facebook.com/groups/toiyeuchuviet4.0/posts/821783012569148/

-------------------

 

BÀI 7: CHỮ VN SONG SONG 4.0 TRONG BỐI CẢNH CÁCH MẠNG CÔNG NGHỆ 4.0

(ngày 1-9-2022)

1.  duyên đến với Chữ VN Song Song 4.0 (Cvnss4.0)

     Những đầu năm 2012 tôi t́nh cờ biết đến Dự án chữ tốc (CTK) qua Phương pháp mới tắt chữ tiếng Việt [1] của tác giả TRẦN TƯ B̀NH2; hồi đi học khi làm các bản đồ trên Arcview GIS3, trong lúc thao táclàm nhăn hiển thị tên địa danhcho các bản đồ thường gặp rất nhiều khó khăn chưa chức năng hiển thị dấu của chữ tiếng Việt. Dự án này đă được giới thiệu từ rất lâu qua Tạp chí công nghệ eChip4 – một tờ báo công nghệ lớn vào thời kỳ internet mới được phổ cập ở Việt Nam. Sau này, tôi biết nhóm tác giả TRẦN TƯ B̀NH KIỀU TRƯỜNG LÂM5  hai nhà nghiên cứu này đă đề xuất Dự án gồm 3 thành phầnChữ Quốc Ngữ hiện hành, Chữ Việt Nhanh   hiệu dấu.

      NvậyCvnss4.0 gần 10 năm sau! nhóm tác giả đă được ghi nhận khi được cấp Bản quyền6  hoàn chỉnh hơn về Cvnss4.0. Nếu khai thác xử tốt th́ Cvnss4.0 sẽ được ứng dụng trong lĩnh vực máy tính rất nhiều, nhất trong bối cảnh của Cuộc cách mạng công nghệ 4.0Cvnss4.0  hoàn toàn không dấu riêng biệt; không cần phần mềm tiếng Việt; nếu biết Chữ Quốc Ngữ (CQN) th́ việc học Cvnss4.0 rất dễ bởi quy tắt của khá đơn giản, dễ hiểu học nhanh.

2. Cvnss4.0 trong bối cảnh Cách mạng công nghệ 4.0 (CMCN 4.0)

     Cuộc cách mạng công nghệ 4.0 (CMCN 4.0) [2] được hiểu ngắn gọn như sau: CMCN lần 1:  khí hóa; CMCN lần 2: Điện khí hóa; CMCN lần 3: Tự động hóa  CMCN lần 4: Số hóaSố hóa (Digitization)  quá tŕnh chuyển đổi thông tin trên giấy  các quy tŕnh thủ công thành định dạng kỹ thuật sốSố hóa  tầm quan trọng rất lớn đối với việc quản , khai thác, xử , lưu trữ truyền dữ liệu.

     T dụ: Ta lấy công nghệ OCR7 để số hóa trong việc đọc text (chữ) ở file ảnh, đây một công cụ scan kỹ thuật số chuyên nhận dạng các tự, chữ viết tay, hay chữ đánh máy để truyền tải kỹ thuật số dưới nhiều dạng tài liệu khác nhau: hóa đơn, hộ chiếu, danh thiếp, tài liệu, … Tuy nhiên! phụ thuộc vào độ nét của ảnh dùng, xử  dấu tiếng Việt, nhận diện mẫu chữ – khó khăn nhất vẫn  chữ viết tayCvnss4.0 được nhóm tác giả thiết lập  hệ thống hiệu  quy tắc giống như hệ thống định toán học trong môi trường máy tínhbước đệmtrung gian để chuyển hóa những giá trị của chữ tiếng Việt hiện tại chưa được tối ưu sang hệ thống quy ước hội ở thế giới thực.

3. Ứng dụng Cvnss4.0 đang hướng đến

      Hiện nay! bắt đầu đă nhiều ứng dụng được tạo ra từ Cvnss4.0 [3], [4], [5]. Tuy nhiênCvnss4.0  tiềm năng vấn rất lớnnhất trong môi trường tương tác giữa con ngườimáy tính (Human-Computer Interaction).

3.1 Ngôn ngữ trị liệuluyện trí nhớ

- Thứ nhất: Quá tŕnh ghi nhớ từ vựng, cụm từ quy tắc ngữ pháp đều thực hiệntế bào năo của bạn. Các bài tập thể dục trí năo từ Cvnss4.0 sẽ giúp rèn luyện trí nhớ tổng thể hàng ngày. Nhiều nghiên cứu đă chỉ ra rằng những người học song ngữ ít nguy mắc bệnh Alzheimer8 hơn. Nếu áp dụng Cvnss4.0 th́ sẽ thể cải thiện trí nhớ đáng kể.

- Thứ hai: Nhằm làm tăng khả năng nhớ của bộ năo, nhiều nhà khoa học đă nghiên cứu t́m ra các phương pháp ghi nhớ. Các phương pháp này hiện nay được những người tham gia cuộc thi trí nhớ thế giới sử dụng thuần thục. Bất cứ ai cũng thể sở hữu trí nhớ gần như hoàn hảo nhờ luyện tập phương pháp hóaNguyên tắc căn bản giúp con người tăng cường trí nhớ   hóa những chủ thể khó nhớ ( dụ như số điện thoại, tên người, công thức toán) thành những chủ thể dễ nhớ đối với năo người ( dụ như h́nh ảnh, địa điểm, cảm xúc)Cvnss4.0 cũng được thiết kế dựa trên phương pháp hóa.

- Thứ baCvnnss4.0 ước tính giảm được gần 30% thời gian ; với những người các cơn đau liên quan đến máy tính (bệnh RSI)9 th́ gần 30% rất nhiều. Một giờ phím liên tục sẽ chỉ c̣n 40-45 phút, 5 giờ phím liên tục chỉ c̣n 3 giờ, v.v. Tất nhiên! con số 30% này cần được xác minh thêm ngay cả như vậyhiệu quả của với việc giảm thiểu các vấn đề về RSI cũng cần được khảo sát kỹ.

3.2 Ngôn ngữ hiệu mật

     Trong mật học ta thấy việcchuyển vị Caesar một trong những kỹ thuật hóa đơn giản, phổ biến nhất lịch sử lâu đời nhất. Đây một dạng mật thay thế, trong đó mỗi tự trên văn bản thô sẽ được thay bằng một tự khác, vị trí cách một khoảng được xác định trong bảng chữ cái; các quy tắc thay thế chữ cái đơn trong bảng chữ cái tiếng Anh qua việc sử dụng 26 mật Caesar10 với các bước dịch chuyển từ 0 đến 25 – tương ứng từ chữađến chữz’. Nếu ai biết Chữ Quốc Ngữ (chữ tiếng Việt) th́ sau khi học thêm Cvnss4.0 sẽ khá hữu ích trong việc ứng dụng các mật  dùng tiếng Việt hoàn toàn.

      T dụ Capcha11 được máy tính tạo ra để xác định tínhcon người”, chủ yếu  reCaptcha  noCaptcha. Khi phải dừng lại để xác minh  Captcha th́ rất nhiều người cảm thấy phiền phức nhất  người Việt. Việc Cvnss4.0 được dùng trong việc xác định từ/cụm từ sẽ rất hữu ích việc chuyển đổi nhận dạng CQN-Cvnss4.0 – ngược lạisẽ giúp ta chống lại việc spam, bảo vệ cho dữ liệu, tính chân thực trong tương tác giữa người máy tính.

      Hay nhưPrivate Key hoặc Seed Phare  chiếc ch́a khoá giúp bạn truy cập vào cánh cổng đó tương tác với tài sản của bạn trên  điện tử. Những cụm từđôi khi trở nên nghĩa bạn không nhớ chính xácdẫn đến mất luôn  điện tử  tài sản của ḿnh chứa trong đó. Do vậyCQN-Cvnss4.0 – ngược lạisẽ giúp bạn dễ nhớ nếu lỡ quên từ khóa mật.

3.3 Hỗ trợ cuộc sống cho người khiếm thị

    Ngày nay, việc áp dụng công nghệ OCR đă được tích hợp với công nghệ tổng hợp giọng nói (giọng máy) giúp máy khả năng đọc hiểu văn bản. thể thông qua Cvnss4.0 để cải tiến chữ Braille12 cho người khiếm thị dùng được dễ dàng hơn. Nói cách khác, văn bản không chỉ được phần mềm máy tính giải , c̣n được công cụ tổng hợp giọng nói đọc ra thành tiếngGiọng nói vi tính hóa đă được ứng dụng vào việc đọc văn bản giúp người cao tuổi, người khiếm thính đọc sách, báo khiến cuộc sống của họ trở nên nhẹ nhàng hơn; hoặc giúp nhân bản được chính giọng nói của ḿnh trong các ứng dụng để phục vụ cho các ngành dịch vụ, truyền thông tiếp thị qua việc xử chuyển đổi ngôn ngữ giọng nói nhân.

3.4 Bảo tồn các văn bản giá trị của các dân tộc

     Tại các bảo tàng, thư viện cổ hay các trung tâm văn hóa lịch sử, người ta cần lưu trữ rất nhiều tài liệu, hồi , bản thảo, …; các tài liệu này rất dễ bị mối mọt theo thời gian. Quá tŕnh lưu trữ cần rất nhiều thời gian, công sức không hề đơn giản. Việc sắp xếp, lưu trữ hoặc t́m kiếm thủ côngvới lượng văn bản giấy khổng lồ cùng vất vả tốn nhiều nhân lực thực hiện. Tuy nhiênCvnss4.0 ra đời đă giúp giải quyết bài toán đó một cách đơn giản hơn thông qua việc chuyển đổi ngôn ngữ theo một quy chuẩn nhất định. Các văn bản, tài liệu quan trọng được chuyển đổi từ dạng giấy sang file mềm. Giúp việc lưu trữ bảo tồn nhiều di sản văn học/văn hóa của các dân tộc trở nên dễ dàng hơn. Trong số 27/54 dân tộc đă chữ viết th́ cũng c̣n nhiều chữ viết chưa được hóa, chưa font chữ bộ trên máy tính. Không chữ viết font chữ th́ rất khó để bảo tồn duy tŕ ngôn ngữ đó, không quảng được trên Internet

      Cvnss4.0 sử dụng các  tự Latin  sử dụng các tổ hợp tự tiếng Việt nên thể tạo ra các tự chữ viết cho ngôn ngữ của các dân tộc, nhằm hạn chế tạo ra font chữ bộ mới. Vấn đề này cần sự phối hợp giữa các nhà ngôn ngữ học chuyên gia xử  ngôn ngữ tự nhiên (natural language processing – NLP).

4.  hội thách thức của Cvnss4.0

4.1 Công nghệ Blockchain

     Blockchain hiện một công nghệ mới sáng tạo tiềm năng thay đổi cách chúng ta tương tác với internet thế giới kỹ thuật số. Ở dạng đơn giản nhấtBlockchain  một sở dữ liệu phân tán cho phép thực hiện các giao dịch an toàn, minh bạch chống giả mạo, nghĩa thông tin thể được lưu trữ trên blockchain  được chia sẻ trên một mạng máy tính không cần quan tổ chức nào hoặc người trung gian bên thứ 3.

      Ví dụHợp đồng thông minh  thể được sử dụng để tự động thực hiện các thỏa thuận khi đáp ứng các điều kiện nhất định, theo đó việc thực thi thể diễn ra không cần bất kỳ sự can thiệp nào của người dùng. Trong suốt quá tŕnh hoặc tại các điểm tiếp xúc chính trong quá tŕnh triển khai, dữ liệu được lưu trữ trên blockchain cũng thể được phân tích bằng cách sử dụng các thuật toán NLP để trích xuất những thông tin chi tiết giá trị. Cuối cùng, sử dụng Bockchain  NLP cùng nhau thể giúp bảo vệ quyền riêng .

4.2 Các ứng dụng & Trường hợp sử dụng của việc kết nối blockchain-NLP từ Cvnss4.0

4.2.1 Trên diện toàn cầu! để hội thể giúp lưu trữ hồ tốt hơn xác minh dữ liệu đáng tin cậy hơnBlockchain giúp tạo ra một hệ thống lưu trữ hồ  an toàn không bị thao túng hoặc can thiệp. dụ: Khi bạn tạo các hợp đồng thông minh Ethereum13, tức bạn đang viết một đoạn code backend cho Dapp (một mạng phi tập trung) bằng ngôn ngữ dành riêng cho Ethereum – chẳng hạn như Solidity, SerpentVyper. thể được xem  ngôn ngữ riêng biệt trong hợp đồng thông minh (smart contract) của cấu trúc Dapp (frontend + smart contract backend).

4.2.2 Cvnss4.0  tiềm năng dành cho công nghệ blockchain khi được sử dụng kết hợp trong NLP để tạo điều kiện cho các hợp đồng thông minh bằng nội dung  Cvnss4.0 đính kèm theo. Các hợp đồng này sẽ cho phép tính kinh tế theo quy tăng độ chính xác khi thực hiện các thỏa thuận giữa nhiều bên giúp đảm bảo rằng tài sản trí tuệ được bảo vệ quản một cách hợp .

4.2.3 Cuối cùngCvnss4.0 – được ứng dụng trong cả công nghệ blockchain  NLP – thể được sử dụng kết hợp với nhau để tạo ra các ứng dụng phi tập trung mới (dApps)  ngôn ngữ giao tiếp riêng. Các ứng dụng nàysẽ hoạt động ngoài tầm kiểm soát của bất kỳ bên nào hoặc tổ chức nàocung cấp một cách để người dùng kiểm soát dữ liệu của họ. Nếu việc này không cẩn trọng th́ sẽ rất nguy hiểm  Cvnss4.0 sẽ bị kẻ xấu lợi dụng  bị xem như ngôn ngữ trong môi trường Web xấu (Dark web).

5. Kết luận

      Có thể thấy,  Dự án Cvnss4.0  một nỗ lực cải cách chữ viết của nhóm tác giảkhông dựa trên một lập luận ngôn ngữ học nào dựa trên những mong muốn rất phi ngôn ngữ học tức  viết không dấu  tối ưu hóa bằng mọi giá, nên hóa ra lại thể một gợi ư quan trọng cho các dự án về công nghệ trong việc tận dụng sự cải cách chữ viết này, như tiếp tục cải tiến các bộ  như VNI hay Telex trên các thiết bị di động smarphone, trong một số trường hợp bắt buộc phải sử dụng tiếng Việt không dấu  Cvnss4.0 trở thành một lợi thế trên môi trường máy tính. Việc thay đổi nhận thức hội phải thời gian lộ tŕnh cụ thể cho từng dự án cộng đồng được ứng dụng cụ thểtừ đóCvnss4.0 sẽ được phát huy tính hiệu quả của .

CHÚ GIẢI

1:  Long Ngo:  Tên thật  NGÔ HOÀNG ĐẠI LONG – hiện đang  Nghiên cứu viên tại Phân hiệu Đại học Quốc gia-TP.HCM tại tỉnh Bến Tre,  nhiều công tŕnh khoa họcđược công bố trên Scopus & WoS – liên quan đến hướng nghiên cứu của ḿnh về Địa ngôn ngữnhất các Ứng dụng của xử ngôn ngữ tự nhiên (Natural Language Processing – NLP) trong GIScience. (Facebook: Long Ngo – https://www.facebook.com/dailong0606 , Email: ngohoangdailong@gmail.com)

long.ngo-blockstạk-vietnamhoc.net

H́nh: Lớp học cách xây dựng các Ứng dụng phi tập trung từ Blockstack/Stack 2018
                 (Tác giả Long Ngo mặc áo đỏ, ngồihàng ghế nh́)

 2:  TRẦN TƯ B̀NH (1954, Đà Nẵnghiện đang sống tại thành phố Sydney, Úc). Ông tốt nghiệp Trường Cao đẳng phạm Tiểu Học Đà Nẵng (năm 1974), Trường Đại học Tổng hợp Tp.HCM (năm 1977) chuyên ngành Ngữ Văn. Ông  Giáo viên Văn tại Trường Trung học Phổ thông cấp 3 Lư Thường Kiệt, Tp.HCM (từ 1977-1980). Ở Úc, ông làm việc tại Bưu Điện Úc (từ 1982 đến nay /2022)  dạy thêm Việt ngữ ở Liên Trường Văn hóa Việt Nam- Sydney (từ 1986-2016) vào cuối tuần.  Ông phụ trách Quản trị trang mạng Chữ Việt Nhanh (http://chuvietnhanh.sf.net).

tran.tu.binh-kieu.truong.lam-cvnss4.0-vietnamhoc.net             

H́nh: Cvnss4.0 & Đồng tác giả TRẦN TƯ B̀NH – KIỀU TRƯỜNG LÂM

3:  Arcview GIS  phần mềm thương mại (của ESRI) về hệ thống thông tin địa  (GIS) giúp: Hiển thị các lớp bản đồ dạng vector, Tạo thay đổi  sở dữ liệu của các đối tượng địa trên bản đồ, Tạo các biểu đồ đơn giản dựa trên thuộc tính của các đối tượng trên bản đồ, Chuẩn bị các bản in ra giấy, Tạo các đoạn chương tŕnh phục vụ cho việc tự động hóa các thao tác phần mềm, Đọc các định dạng ảnh khác, Tạo các hộp thoại (giao diện đồ họa người sử dụng), v.v

4:  Echip  tạp chí về công nghệ thông tin ở Việt Nam, ra đời vào tháng 2/2003 trực thuộc Bộ Thông tin Truyền thôngEchip  3 loại báo tuầne-CHÍP Tin học trong tầm tay (phát hành vào thứ 6)e-CHÍP Đọc xong vọc liền (phát hành vào thứ 3)e-CHÍP Mobile (phát hành vào thứ 4). Sau 13 năm hoạt độngEchip đă dừng phát hành báo giấy  chuyển sang hoạt động theo dạng báo điện tử từ ngày 1/5/2016.

5:  KIỀU TRƯỜNG LÂM (1986, Tuy Ḥa, Phú Yên – hiện đang sống tạiNội). Ông tốt nghiệp Cử nhân Quản trị Kinh doanh – chuyên ngành Marketing tại Trường Đại học Kinh Tế, Huế  làm việc ở ngành Mậu dịch quốc tế. Ông TRẦN TƯ B̀NH Đồng tác giả Dự án Chữ Việt Nam Song Song 4.0.

6:  Giấy Chứng nhận Đăng Quyền Tác phẩm số 1850/2020/QTG do Bộ Văn hoá Thể thao Du lịch, Cục Bản Quyền cấp ngày 25/3/2020.

7:  Công nghệ OCR (Optical Character Recognition) – công nghệ nhận dạng tự quang học ứng dụng công nghệ chuyên dùng để đọc text ở file ảnh.

8:  Bệnh Alzheimer (AHLZ-high-merz) –  bệnh về năo – tác động đến trí nhớ, suy nghĩ hành vi. Bệnh Alzheimer không phải bệnh lăo khoa thông thường hoặc bệnh thần kinhBệnh Alzheimer chiếm khoảng 60-80% trong những bệnh làm suy giảm trí nhớHội chứng suy giảm trí nhớ  thuật ngữ tổng quát về việc mất trí nhớ  các khả năng duy đến mức nghiêm trọng thể gây trở ngại cho cuộc sống thường ngày.

9:  Bệnh RSI (Repetitive strain injury)  hội chứng bệnh nghề nghiệp – chấn thương do căng lặp lạithường gặpngười phải bàn phím máy vi tính, phải đẩychuộtnhiều lần trong ngày.

10:  Mật Caesar  kỹ thuật hóa đơn giản phổ biến nhấtMật Caesar thay thế tự trên văn bản thô bằng một tự khác vị trí cách một khoảng xác định tuỳ chọn trong bảng chữ cái. dụ: với độ dịch chuyển 3, D sẽ trở thành A, E sẽ trở thành B, …, v.v. Tên Caesar của kỹ thuật hóa này được đặt theo tên của JULIUS CAESAR (vị tướng La đă sử dụng trong các thư từ mật).

11:   Capcha (Completely Automated Public Turing test to tell Computers and Humans Apart)  Phép thử tự động để phân biết máy tính với con người Captcha ra đời nhằm hạn chế các phần mềm tự động gây hại đến các trang web, trang dịch vụ Captcha thường các chữ, số bị làm biến dạng hay sắp xếp lộn xộn để trở nên khó đọc nhằm làm chậm thời gian truy cập Captcha được thiết kế để xác nhận thao tác đúng bởi con người (tỷ lệ 80%) hay robot (0.1%).

      reCaptcha  những h́nh chụp, bản scan từ đời thật. Người sử dùng cần nhận dạng xác nhận một số h́nh theo yêu cầu của  reCaptcha.

     noCaptcha  phiên bản cải tiến của  reCaptcha noCaptcha chỉ yêu cầu đơn giản bạn cần kích chuột vào ô “không phải robotnhằm giúp hệ thống phân tích hành vi của bạn nếu nghi ngờ việc kích chuột diễn ra tự động th́ các  Captcha hoặc  reCaptcha sẽ hiện ra để yêu cầu thực hiện thêm bước xác thực..

12:  Chữ Braille – được LOUIS BRAILLE phát minh (năm 1821) – hệ thống chữ nổi giúp người , người khiếm thị sử dụng. Mỗi chữ Braille được tạo thành từ 6 nốt nổi/ch́m nhằm tạo ra một bộ 64 (26) kiểu tổ hợp nốtmỗi kiểu thể hiện một tự thể giúp nhận dạng bằng cách sử dụng ngón tay rờ đọcđược chữ.

13:  Hợp đồng thông minh Ethereum (HĐTM, Smart Contract) được NICK SZABO tả lần đầu tiên vào những năm 1990. HĐTM  công cụ để chính thức hóa bảo mật mạng máy tính khi giao dịch bằng cách kết hợp các giao thức với giao diện người dùng không cần dựa trên sự tin cậyhai bên trong hợp đồng thể đưa ra các cam kết thông qua blockchain  không cần phải biết nhau hoặc tin tưởng lẫn nhau – song vẫn đảm bảo nếu các điều kiện của hợp đồng không được thỏa măn th́ sẽ không được thực thi… Tuy nhiênHĐTM thực chất không phải một hợp đồng pháp HĐTM không cần bất cứ các bên trung gian nào giúp giảm đáng kể chi phí hoạt động, chi phí hành chính.

     HĐTM  Ứng dụng chạy trên blockchain  được sử dụng trong nhiều lĩnh vực khác nhaucác hệ thống tín dụng, xử thanh toán, quản bản quyền nội dung, v.vHĐTM giống như Hợp đồng kỹ thuật số đươc thực hiện bởi một bộ quy tắc cụ thểcác quy tắc này được code của máy tính xác định trước; tất cả các node trong mạng  thể sao chép thực thi các quy tắc đóGiao thức Bitcoin đă hỗ trợ HĐTM trong nhiều năm qua đặc biệt hữu ích trong các việc chuyển/trao đổi tiền giữa hai/nhiều bênHệ thống HĐTM  thể tạo ra các tài sản được token hóa, các hệ thống bầu chọn tiền hóa, các sàn giao dịch phi tập trung, các tṛ chơi  ứng dụng di động; mặt khác, cũng thể kết hợp HĐTM với các giải pháp blockchain khác như chăm sóc sức khỏe, từ thiện, chuỗi cung ứng, quản trị, tài chính phi tập trung (DeFi).

Tài liệu tham khảo

[1].  TRẦN TƯ B̀NH. Cách gơ tắt chữ Việt không dấu. http://chuvietnhanh.sourceforge.net/CachGoTatChuVietKhongDau.htm
[2].  The Fourth Industrial Revolution.
[3].  KIỀU TRƯỜNG LÂM & TRẦN TƯ B̀NH. Công thức CHỮ VN SONG SONG 4.0 và Ví dụ. http://chuvietnhanh.sourceforge.net/CongThucChuVNSongSong4.0VaViDu.htm
[4].  KIỀU TRƯỜNG LÂM & TRẦN TƯ B̀NH. Chữ VN Song Song 4.0. http://chuvnsongsong.com/
[5].  KIỀU TRƯỜNG LÂM & TRẦN TƯ B̀NH. Hướng dẫn gơ nhanh chữ Việt trên máy vi tính bằng Kiểu gơ CVNSS4.0 với Bộ gơ Evkey. http://chuvietnhanh.sourceforge.net/GoNhanhChuVietTrenMayViTinhBangKieuGoCVNSS4.0VoiBoGoEVKey.htm

Long Ngo

Nguồn: https://vietnamhoc.net/chu-vn-song-song-cvnss4-0-trong-boi-canh-cach-mang-cong-nghe-4-0/

-------------------

 

BÀI 8: CHỮ VN SONG SONG 4.0 VỀ MẶT NGÔN NGỮ

(ngày 6-9-2022)

Ngôn ngữ  phương tiện giao tiếp chính của con người, thể tồn tạidạng lời nói, hiệu hoặc chữ viết. Ngôn ngữ gồm: ngôn + ngữ, trong đó: ngôn: lời lói, tiếng nói; c̣n ngữ biểu hiện dưới dạng hóa giải theo cách trực quan nhằm lưu trữ thông tin chuyển giao tin nhắn dưới dạng chữ viết hoặc tự/ hiệu. Như vậy, ngôn ngữ dựa trên quy ước hội.

Trong phạm vi chủ đề này, tôi xin bàn về hệ thốngchữ viếtcủa Cvnss4.0, nhằm làm sáng tỏ những hoài nghi hoặc hiểu lầm trong các tranh luận trước đây sau khi nhóm tác giả công bố được cấp bản quyền theo văn bản pháp [850/2020/QTG] đă gây tranh căi lớn trên mạng hội từ tháng 3/2020 đến nay, vẫn c̣nnóng”.

(i) Mặc , nhóm tác giả đă chia sẻ quan điểm không ư định cải tiến Chữ Quốc Ngữ, tôi rằng đây  giải pháp hữu íchtrong việc gia tăng thêm giá trị Chữ Quốc Ngữ trong bối cảnh Cách mạng công nghệ 4.0 hiện nay trên nhiều môi trường trong đó môi trườngsố hóa”, phục vụ chochuyển đổi sốhiện nay.

dụ: tập tin HEX khi hóa cụm từChữ Quốc Ngữsẽ 43681EEF2051751ED163206E671EEF, nhưng trong môi trường máy tính biểu hiện ra sẽ “Ch‑ï Qu‑Ñc ng‑ï”. Nhưng Cvnss4.0 “Chữ Quốc Ngữsẽ Chuw Qocb wuw”, từ đây chuyển ra Chữ Quốc Ngữ sẽ dễ dàng hơn. Do Cvnss4.0 tuân thủ đúng theo quy định ASCII. Trong khi, bảng ASCII Tiếng Việt hiện cũng c̣n khá rối rắm.

(ii) Khi nói đến chữ viết chúng ta sẽ thấy rất nhiều chữ hiện nay đang tồn tại ở Việt Nam như: khi nói tiếng Pāli (पाळि) (Phật giáo Nam Tông) - không chữ viết đi theo, nhưng để biểu đạt nhiều chữ viết trong đó chữ Chữ Khmer (không thanh điệu), bản thân chữ này lại xuất phát từ chữ Pallava, chữ Brahmi. Nếu bạn muốn học tôi nghĩ khi cả đời không hiểu hết, chưa kể hiện nay c̣n Việt Khmer, Trung Khmer…

Trong khi đó, Tiếng Việt sử dụng bảng chữ cái Latin hệ thống thanh điệu phức tạp. Cho nên, nói Cvnss4.0 không thanh điệu chưa phù hợp. Khi nói chữ viết thanh điệu hay không thanh điệu không phải biểu hiện về mặt tối ưu tối giản của chữ viết trong việc truyền tải thông tin.

(iii) Tiếng Việt một ngôn ngữ mẹ đẻ người ta thừa hưởng từ khi vừa được sinh ra kéo dài liên tục trong thời thơ ấu. Chính nhờ vậy dân tộc ta không bị đồng hóa. Cả nước hiện nay chỉ mới 27/54 dân tộc đầy đủ tiếng nói chữ viết bản địa chỉ dân tộc Hoa, Chăm, Khơ-me sẵn tiếng nói chữ viết riêng của họ.

Chữ viết tiếng Việt của chúng ta hiện nay Chữ Quốc Ngữ, bộ chữ hiện dùng để ghi lại tiếng Việt dựa trên các bảng chữ cái của nhóm ngôn ngữ Rôman với nền tảng tự Latinh.

Như vậy, Cvnss4.0 dựa trên nền tảng Chữ Quốc Ngữ nhằm phát triển song song trên nhiều môi trường khác nhau (trong đó môi trường kỹ thuật số), nhằm tăng giá trị biểu đạt, trực quan hóa, phát huy bản sắc riêng về văn hóa tiếng Việt thay chủ ta phải chủ động lệ thuộc quá nhiều vào tiếng Anh, tiếng Việt dấu hiện nay.

dụ: tên gọi của ḿnh theo tiếng Anh viết như thế nào cho đúng, hay như giao dịch ngân hàng, bưu điện, ... tất cả điều không dấu, vậy chuẩn chung không? Hay như phiên âm tiếng nước ngoài...

(iv) Hướng đến sự tối giản hóa để đạt đến tính ưu việt, dễ dàng, linh hoạt nhằm đơn giản hóa ư nghĩ giao tiếp: Toki-Pona, Esperanto, Interlingua, Quenya, Volapük… Như vậy, khi một ngôn ngữ nào phát sinh, không suy nghĩ trước trong năo bộ của con người, không nhất thiết phải tuân thủ củangôn ngữ tự nhiên" Cvnss4.0 tuân thủ theongôn ngữ xây dựng ngôn ngữ h́nh thức hay ngôn ngữ thông tin, khác với ngôn ngữ giao tiếp thường nhật.

dụ: Interlingua hay tiếng Khoa học Quốc tế ( ngôn ngữ ISO 639 ia, ina) một ngôn ngữ phụ trợ quốc tế (IAL), được Hiệp hội Ngôn ngữ Phụ trợ Quốc tế (IALA) phát triển từ năm 1937 1951. Đây ngôn ngữ phụ trợ quốc tế được sử dụng rộng răi thứ hai hoặc thứ ba, sau Esperanto sau Ido, ngôn ngữ phụ trợ tự nhiên được sử dụng rộng răi nhất, nói cách khác, từ vựng, ngữ pháp của các đặc điểm khác phần lớn bắt nguồn từ ngôn ngữ tự nhiên. Ban đầu, cũng rất nhiều tranh căi về . Do vậy, Cvnss4.0 cũng giống như “Lingua franca” (c̣n gọi ngôn ngữ cầu nối/hỗ trợ/đi làm/du lịch) dạng ngôn ngữ phái sinh”, một cách hệ thống, dùng để giao tiếp.

Tóm lại, hiện tượng khúc xạ trong ngôn ngữ, giao thoa, cải biên... điều b́nh thường trong tiến tŕnh của một ngôn ngữ. Để giữ được bản sắc riêng của ḿnh, tôi lấy dụ ngôn ngữ của Nhật Bản rất phức tạp, những họ vẫn tôn trọng tôn trọng sự sáng tạo nhân giữ ǵn để trở thành một cường quốc.

Ǵn giữ được sự trong sáng của tiếng Việt giữ ǵn được nền tảng văn hóa ngôn ngữ Việt Nam Cvnss4.0 đă đạt được thống nhất trong quy ước, quy luật nguyên tắc sử dụng riêng. Nh́n sang các nước khác trong khu vực, như Nhật Bản từng chịu ảnh hưởng sâu đậm của Hán văn, nhưng họ vẫn giữ được bản sắc văn hóa của riêng ḿnh, ngôn ngữ của họ rất phức tạp đến 3 bộ vần đó : higarana katakana biểu âm; bộ kanji dựa trên chữ Hán biểu ư. Ngoài ra, c̣n tiếng Nhật Romaji cách để tiếng Nhật được lan tỏa rộng trong cộng đồng ra thế giới.

Long Ngo

Nguồn: https://www.facebook.com/groups/toiyeuchuviet4.0/posts/829485318465584/

-------------------

 

BÀI 9: CVNSS4.0 - THUỘC NHÓM CÁC NGÔN NGỮ IAL?

(ngày 8-9-2022)

Chữ VN Song Song 4.0 (Cvnss4.0) dưới góc độ t́m hiểu của tôi được xem ngôn ngữ được xây dựng (constructed languages) thuộc nhóm các ngôn ngữ "auxiliary" nghĩa bổ trợ song song cho một mục đích nào đó về văn hóa, thiết kế nghệ thuật thế giới phân loại, tồn tại hiện nay khoảng 40 ngôn ngữ như thế. Các ngôn ngữ bổ trợ quốc tế (IAL - International auxiliary language) các ngôn ngữ được xây dựng để cung cấp giao tiếp dễ dàng, nhanh chóng hơn hoặc được cải thiện giữa các đối tượng giao tiếp hoặc một phần đáng kể, không nhất thiết phải thay thế ngôn ngữ mẹ đẻ ḿnh [Otto Jespersen, 1908]

Trong 11 ngôn ngữ sau đây tôi thử làm phép phân tích để thấy được giá trị lợi ích Cvnss4.0 mang lại.

1) Esperanto (L. L. Zamenhof, 1887) một bác nhăn khoa tạo ra;

2) Volapük (Johann Martin Schleyer, 1879) mục tạo ra;

3) Ido (Louis Couturat, 1907) khởi xướng tiền thân của chữ Novial sau này;

4) Interlingua (IALA, 1951) một tổ chức tên Hiệp hội Ngôn ngữ Phụ trợ Quốc tế Hoa Kỳ tạo ra;

5) Kotava, (Staren Fetcey, 1978)

6) Interlingue (Edgar de Wahl, 1922)

7) Lingua Franca Nova (C. George Boeree, 1965)

8) Novial (Otto Jespersen, 1928)

9) Lojban (LLG, 1987), sau này Loglan

10) Toki Pona (Sonja Lang, 2001)

11) Klingon (Marc Okrand, James Doohan, Jon Povill, 1985)

những ngôn ngữ như Esperanto (Quốc tế ngữ) số lượng người dùng rất cao gần 200,000 người dùng. thể thấy như: các ngôn ngữ này điều được sáng tạo ra từ bằng việc cải tiến bảng chữ cái Latinh, nhằm để đơn giản hóa suy nghĩ giao tiếp (Toki Pona); giao tiếp giữa những người thuộc các nền tảng ngôn ngữ khác nhau, như một phương tiện dịch máy tiềm năng như một công cụ để khám phá sự giao thoa giữa ngôn ngữ của con người phần mềm (Lojban, 1987); hay như các từ vựng được tạo ra ngôn ngữ Đức Roman, ngữ pháp của bị ảnh hưởng bởi tiếng Anh (Novial, 1928). Hoặc chỉ để tạo hệ thống ngữ pháp cực kỳ đơn giản dễ học (Lingua Franca Nova, 1965) …

Cvnnss4.0 tính kế thừa như: Toki Pona, Lojban, Nova nếu xét trên các đặc tính trên.

Theo thuyết ngôn ngữ Sapir-Whorf, điều này tầm quan trọng lớn hơn nhiều, một vai tṛ quan trọng hơn nhiều khi tổ chức, suy nghĩ hoặc thậm chí nhận thức thế giới. Do vậy, để kiểm tra ảnh hưởng của ngôn ngữ đối với suy nghĩ của người nói, thuyết này chỉ ra rằng vai tṛ của (hoàn cảnh địa , bối cảnh văn hóa) khi đưa ra một khuôn khổ để xây dựng nhận thức của chúng ta để chúng ta khả năng quan sát về thế giới trong phạm vi được áp đặt bởi hội. Điều này, giúp ta khẳng định bạn không thể giải thích sự vật, hiện tượng bằng các ngôn ngữ khác bởi mỗi ngôn ngữ các thuật ngữ khái niệm riêng của .

dụ: khi nói về con nước của người miền Tây (nước rong, nước ṛng, nước lớn, nước kém, …). Hay như, thuật ngữ “umami” trong khái niệm tiếng Nhật đề cập đến một hương vị bắt nguồn từ nồng độ glutamate đối với các ngôn ngữ khác không bản dịch cụ thể, rất khó để tả.

khía cạnh nào, Cvnss4.0 -tip khá giống với Loglan (http://www.loglan.org/?fbclid=IwAR2SWDNg3cBEk2uBlxkDDvHRvOpT2c4J7OdnsozfR4oWVDgW5yPqst-pZfE)

Tóm lại, việc xuất hiện thêm Cvnss4.0 cũng phù hợp với tiến tŕnh chung của các ngôn ngữ được xây dựng trên thế giới. Vấn đề bây giờ làm sao để khai thác hiệu quả các tính năng Cvnss4.0 mang lại.

Long Ngo

Nguồn: https://www.facebook.com/groups/toiyeuchuviet4.0/posts/830803431667106/

-------------------

 

BÀI 10: CHỮ QUỐC NGỮ TRONG TIẾN TR̀NH LỊCH SỬ DÂN TỘC

(ngày 15-9-2022)

Chữ Latinh  loại văn tự chữ cái được sử dụng rộng răi nhất trên thế giới hiện nay. Chữ Quốc Ngữ  tập hợp các chữ cái Latinh  dấu phụ được dùng cùng với các chữ cái đó để viết tiếng Việt. Như vậy, thông qua việc thêm dấu phụ lên các chữ cái sẵn, ghép nhiều chữ cái lại với nhau, sáng tạo ra chữ cái mới hoàn toàn hoặc gán một chức năng đặc biệt do một bộ đôi hoặc bộ ba chữ cái. Vị trí của các chữ cái mới này trong bảng chữ cái thể khác nhau, tùy thuộc từng ngôn ngữ.

Bảng chữ cái Latinh đầu tiên chỉ 21 chữ cái thiếu đi /J/, /G/, /Y/, /Z/, /W/. Do sự phát triển của từng ngôn ngữ của từng quốc gia sự bổ sung biển đổi cho phù hợp như: trong tiếng Đức người ta thêm dấu umlau trong các chữ cái ä, ö, ü của tiếng Đức.

Chữ Quốc Ngữ giai đoạn mới h́nh thành, trên chặng đường lịch sử hàng trăm năm chỉnh , bổ sung phát triển nhưng chưa đủ phổ biến để coi văn tự chính thức măi cho đến 1880, các văn kiện chính thức được dùng Chữ Quốc Ngữ, lẽ cụ Trương Vĩnh đă công trong việc truyền tải chữ này qua nhiều tác phẩm ngày nay chúng ta mới dịp thưởng lăm, như: Truyện thơ Lục Vân Tiên.

畧畑䀡傳西銘

(Trước đèn xem chuyện Tây Minh)

Đến những năm thời kỳ đầu 1900s, th́ cả nước bắt đầu cùng học Chữ Quốc Ngữ Latinh. Như vậy, để thể hiện tiếng Việt, người ta dùng phương pháp âm tiếng Việt bằng chữ cái Latinh, đó việc chuyển thể việc nói tiếng Việt trở thành các tự Latinh thông qua việc thêm dấu phụ trên giấy.

Nói về việc cải tiến Chữ Quốc Ngữ thi Tản Đà (1919), nhà báo Nguyễn Văn Vĩnh (1929), nhà giáo Dương Tự Nguyên (1929), sử gia Trần Trọng Kim (1929) … các tác giả viết nhiều bài tranh luận trên Trung Bắc tân văn xoay quanh vấn đề do sửa đổi Chữ Quốc Ngữ bỏ dấu phụ. Đặc biệt, Vi Huyền Đắc (1929) đề xuất chữ viết ghi âm nhưng mượn chữ Hán, Nhật để chế ra con chữ thay chữ Latin. Sau 1945, Ban chuyên môn B́nh dân học vụ Trung ương (1946) đă soạn thảo văn bản cải cách Chữ Quốc Ngữ. Việc cải tiến trong bối cảnh hội nhập quốc tế từ những năm 2000s khi xuất hiện các hiệu, từ ngữ mới do Internet phổ biến cũng dần chấp nhận nhưng những cuộc tranh luận nảy lửa phải kể đến Bùi Hiền (2017), Hồ Ngọc Đại (2018), …

Ngày nay, nếu dùng thao tác này cho máy tính sẽ khó khăn gấp nhiều lần, thay thể hiện:

Trước đèn xem chuyện Tây Minh -> Trusx denl xem chylf Tayy Mihp (Cvnss4.0)

Công việc này sẽ giảm dung lượng xử của máy tính bằng việc hóa. Bạn thử tưởng tượng nếu bạn ghi nhớ chữ tiếng Việt dấu tốn 10bytes, bạn dùng Chữ VN Song Song 4.0 (Cvnss4.0) sẽ tiết kiệm hơn rất nhiều. Giả định xử lên đến 1GB th́ bạn sẽ tiết kiệm rất nhiều dung lượng.

Chữ Nôm thông qua qua một trường hợp khác cho thấy không chịu ảnh hưởng bởi Chữ Quốc Ngữ! Với lịch sử định trải qua hơn 500 năm, hầu hết dân người Kinh ở khu vực Tam Đảo (Vạn , Vu Đầu Sơn Tâm) cũng như một vài nơi khác ở Quảng Tây (chủ yếu tập trung tại Đông Hưng) thuộc Trung Quốc ngày nay đều chung nguồn gốc người Đồ Sơn (Hải Pḥng, Việt Nam), c̣n lại số ít người Kinh trong đó nguồn gốc từ một vài địa phương ven biển của Việt Nam di đến. Người Kinh Tam Đảo vốn nói tiếng Việt sử dụng phổ biến chữ Nôm, lối giao tiếp như người Việt chỉ điều họ không dùng Chữ Quốc Ngữ. Dân số người Kinh Tam Đảo hiện nay tương đương với vùng ĐBSCL của chúng ta. Như vậy, xét lại lịch sử cho thấy Chữ Nôm bắt đầu h́nh thành phát triển từ thế kỷ X đến thế kỷ XX th́ hạn chế. Chữ này tồn tại 10 thế kỷ, nếu xét về thời gian Chữ Quốc Ngữ c̣n thua xa nhưng do tính ứng dụng phổ biến nên được ưa chuộng sử dụng rộng răi cho đến ngày nay.

Qua đó cho thấy, Chữ Quốc Ngữ, chữ Latinh chữ Nôm cùng chữ Hán xét về gốc hai hệ chữ dùng để viết tiếng Việt, chúng vai tṛ khác nhau nhưng bổ trợ cho nhau trong chiều dài lịch sử văn hóa Việt Nam c̣n phụ thuộc vào hoàn cảnh địa của buổi ban đầu. Việc nghiên cứu chữ viết hay ngôn ngữ rất vất vả, gian nan thậm chí tiêu tốn nhiều thời gian, chưa kể kinh phí cho rất tốn kèm không phải ai cũng đồng cảm được. đứng dưới vai tṛ nào nhân, nhóm hay tổ chức nếu đứnggóc độ nào đó, việc đề xuất ích nhằm giải quyết bài toán nào đó điều rất được trân trọng. Tuy nhiên, vai tṛ của tổ chức bao giờ cũng chiếm ưu thế hơn.

Hiện nay, mặc Chữ Quốc Ngữ được dùng phổ biến nhưng vẫn nhóm nghiên cứu chuyên sâu Hán Nôm! dụ: Ủy ban Phục sinh Hán Nôm Việt Nam đă cho chuẩn hóa 5.524 tự chuẩn, chiếm khoảng 98% lượng sử dụng hàng ngày của tiếng Việt hiện đại. Qua đó cho thấy, tùy vào nhu cầu mục đích khác nhau thể thêm/bớt hoặc bổ sung để cho các tiện ích trong đời sống được tối ưu hóa trong lúc thao tác hóa chữ viết trên các công cụ.

Long Ngo

Nguồn: https://www.facebook.com/groups/toiyeuchuviet4.0/posts/835634777850638/

-------------------

 

BÀI 11: CHỮ VN SONG SONG 4.0 TRONG HÀNH TR̀NH T̀M TIẾNG NÓI ĐỒNG THUẬN

(ngày 1-10-2022)

hơn 7.000 ngôn ngữ trên thế giới này [1]. Con số đó không ngừng tăng lên hàng này, bởi chúng ta đang học thêm về các ngôn ngữ trên thế giới mỗi ngày. hơn thế nữa, bản thân các ngôn ngữ cũng đang thay đổi hàng ngày. Chúng ta đang sống trong một thế năng động, được nói bởi những cộng đồng cuộc sống được định h́nh bởi thế văn hóa lịch sử tồn tại trong một thế giới đang thay đổi nhanh chóng. Đây thời kỳ mọi thứ diễn ra quá nhanh. Khoảng 40% ngôn ngữ hiện nay đang bị đe dọa, thường chỉ khoảng 1.000 người nói sử dụng. Trong khi đó, chỉ 25 ngôn ngữ thường xuyên được sử dụng chiếm hơn 4 tỷ người trên Trái đất này. Việt Nam đứng thứ 20 nhưng tôi đánh giá rằng, không chính xác  15 trên thế giới về mức độ sử dụng. Bởi dân số của chúng cộng động hải ngoại đă vượt quá 100 triệu dân.

Trong đó chữ tiếng Việt lợi thế bởi gốc từ hệ Latinh nên Chữ Quốc Ngữ sự kế thừa phát triển rất nhanh (tiếng Anh, tiếng Pháp, tiếng Tây Ban NhaMặc khác, gốc nghĩa 80% từ vựng tiếng Việt lại thành tố Hán Việt. Hay nói khác đi, Tiếng Việt chủ thể tạo nên nhiều ngôn ngữ khác từ sự kế thừa.

Tuy nhiên, chỉ khoản 3.800 ngôn ngữ  "sử dụng hệ thống chữ viết đă được thiết lập". Điều này bao gồm việc viết các hệ thống cho các ngôn ngữ đă tuyệt chủng các ngôn ngữ xây dựng, hệ thống viết tắt, chữ nổi Braille các hệ thống hiệu khác, nhiều hệ thống chữ viết được liệt hiếm khi được sử dụng. Việc thiết lập hệ thống chữ viết cho nhiều môi trường khác nhau rất cần thiết sẽ đa dạng hóa việc truyền tải “ư thức số/consciousness. Đây một phương thức quan trọng để truyền tải cho brain-computer. Giống như một đứa sinh ra, việc học ngôn ngữ nào do môi trường hội của nơi đó quyết định, đứa sẽ không tự quyết định được việc học ngôn ngữ nào. Tương lai, các con robot máy tính cũng vậy, chúng sẽ tự học tự nhận thức tự giao tiếp bằng ngôn ngữ của chúng do chúng ta tạo ra [3].

Chữ Việt Trí (2012), một bảng chữ cái thay thế cho tiếng Việt do Tôn Thất Chương phát kiến ra. Ông khuyến khích sử dụng Chữ Việt Trí để viết thư pháp, tiểu thuyết nhật , để giao tiếp mật, hoặc chơi các tṛ chơi, viết thư thông minh cho các chức năng văn học tôn giáo. Đặc điểm đáng chú ư: Đây loại hệ thống chữ viết: dựa vào bảng chữ cái Latinh; Hướng viết: từ trái sang phải theo hàng ngang. Chữ Việt Trí bao gồm: 29 chữ cái, 6 âm 10 chữ số. Dùng để viết cho: Tiếng Việt.

Chữ Ṿng, nghĩa đen "chữ viết ṿng tṛn", một bảng chữ cái thay thế cho tiếng Việt do Albert Nguyễn sáng chế (2014). Động lực tạo ra Chữ Ṿng xuất phát từ mong muốn bắt chước khả năng của người Hàn Quốc Nhật Bản, những quốc gia đă từng sử dụng tiếng Trung Quốc làm hệ thống chữ viết duy nhất, để duy tŕ việc sử dụng các tự Trung Quốc cùng với hệ thống chữ viết phiên âm của riêng họ.

Đề xuất cải tiến bảng chữ cái chính tả tiếng Việt (Bùi Hiền, 2016) gây băo mạng.

Nhóm tác giả CVNSS 4.0, công bố công tŕnh nghiên cứu "Chữ Việt Nam song song 4.0" (2020). Nếu các công tŕnh trước đây quá rắc rối trong các quy tắc, luật định. Chưa kể khó thể hiện trong môi trường máy tính. Chúng ta phải nh́n nhận rằng để cho một chữ viết tốt hơn trong môi trường nào đó nhất chữ tiếng Việt ( dấu), hai nguyên tắc trong quá tŕnh nghiên cứu(i) khi nghiên cứu phải phương pháp dựa trên kế thừa trước đó; tức trước khi làm phải quy tŕnh, phương pháp, các bước kiểm soát, đối tượng thực hiện, các điều kiện kèm theo, các kỹ thuật sẽ sử dụngtrong quá tŕnh nghiên cứu luôn sự điều chỉnh để chữ viết trở nên tối ưu hơn; (ii) Phải làm thử nhiều lần chấp nhận phản ứng luận; nếu sai quay lại (1) điều chỉnh để tiếp tục làm tiếpTôi nhận thấy, nhóm tác giả đă không dừng lại luôn sẵn sàng chia sẻ cái của ḿnh làm, cái ḿnh mong muốn ra cộng đồng, chấp nhận cho mọi người phán xét miễn phí. Liệu như vậy, quá bất công với nhóm tác giả CVNSS 4.0 hay không (?)

Long Ngo

Nguồn: https://www.facebook.com/groups/toiyeuchuviet4.0/posts/847555806658535/

-------------------

 

BÀI 12: TIỆN ÍCH NHỎ TỪ CHỮ VN SONG SONG 4.0 MANG LẠI

(ngày 19-10-2022)

Đối với chúng ta tài nguyên số hay nói khác đi dữ liệu trên máy vi tính cực kỳ quan trọng, thậm chí quư hơn vàng. Không dữ liệu th́ đừng bao giờ nói chuyện a,b,c thuật toán hay AI đó. Bởi trong thời đại công nghệ 4.0 như hiện nay, việc soạn thảo lưu trữ các file trên máy vi tính (PC hay Laptop) đă trở nên phổ biến, bởi dữ liệu tạo ra theo thời gian rất ư nghĩa với chúng ta. Tuy nhiên, việc đặt tên tổ chức file, folder (thư mục) như thế nào cho hợp , hiệu quả hạn chế những rủi ro th́ không phải ai cũng thực hiện đúng, ngăn ngừa một số lỗi ngớ ngẩn th́ không phải ai cũng biết. Đa phần người dùng Việt Nam thường mắc phải một số lỗi khi đặt tên file, folder như: đặt tên bằng tiếng Việt dấu, đặt tên quá dài, tạo quá nhiều folder lồng vào nhau….

Việc đặt tên như vậy sẽ thuận lợi cho người sử dụng tiếng Việt, tuy nhiên sẽ gây khó khăn, hạn chế, thậm chí gây ra lỗi trong t́m kiếm, copy, di dời file nhất khi phục hồi (recovery) file bị xóa, lâu dần sẽ bị trùng lắp dữ liệu phái sinh, trong khi dữ liệu nội sinh không cần thiết… do đa phần các phần mềm, hệ điều hành (OS) đều do các công ty nước ngoài phát triển trên các nền tảng ngôn ngữ lập tŕnh nhất định (ngôn ngữ lập tŕnh ngôn ngữ không dấu), chủ yếu bằng tiếng Anh (English) không hỗ trợ tốt hoàn toàn tiếng Việt. Quá tŕnh thao tác hóa, bộ nhớ cache quá nhiều nhất dữ liệu phi cấu trúc tạo ra dẫn đến bộ nhớ chứa rác nhiều hơn chứa những thứ cần thiết từ dữ liệu mang lại.

Ngoài ra, font tiếng Việt thường không được tích hợp sẵn trong các hệ điều hành cũng như các chương tŕnh phải cài đặt thêm các Fonts tiếng Việt vào mới sử dụng được (Một số lỗi điển h́nh chúng ta thể nh́n thấy như: Khi ta gửi kèm file (attach file) đặt tên bằng tiếng Việt dấu qua một số hệ thống mail hay một số chương tŕnh, khi download về, file sẽ bị lỗi tên đổi thành tên khác không dấu…). Các phần mềm crack, các bản chưa cập nhật hoặc các chương tŕnh số lỗi sẽ làm chậm máy thậm chí bị đơ, việc tạo ra các file dẫu tiếng Việt sẽ ngốn thêm tài nguyên của máy tính, nhiều máy sẽ bị liệt

vậy để thực hiện đặt tên file, folder thật sự hợp , hiệu quả hạn chế phát sinh lỗi, nên chú ư một số nguyên tắc sau:

- Nên đặt tên bằng chữ không dấu, thể sử dụng dấu “-” hay “_” thay thế các khoảng trống. (vd: thay đặt tênbáo cáo.doc” nên đặt “bao cao.doc” hay “bao_cao.doc”). Vậy nếu Chữ VN Song Song 4.0 (Cvnss4.0) bạn đặt  baoj caoj.doc

- Đặt tên ngắn gọn, dễ hiểu, ư nghĩa; hạn chế tối thiểu việc đặt tên quá dài (vd: thay đặt tên “Thong tu lien tich so 01 ve thi hanh an dan su.doc” nên đặt “TTLT01 THADS”), nếu đặt thogy tuo.doc th́ sao?

- Đối với các file cần sắp xếp theo thời gian, địa điểm, thể thêm địa điểm, ngày, giờ vào tên file để dễ dàng sắp xếp, t́m kiếm (vd: thay “picture1.png” nên đặt “DaLat_11.07.2020_picture1.png”). C̣n đặt Dal Latr.png

- Nên lưu ư thứ tự sắp xếp tên trong hệ điều hành (vd: trong window sẽ sắp xếp ưu tiên theo thứ tự: “ tự đặt biệt” => “số” => “ tự thường”; nghĩa các file được sắp xếp theo thứ tự “@.doc” => “1.doc” => “a.doc”).

- Không nên tạo quá nhiều lớp folder lồng vào nhau (vd:

D:\FolderA\FolderB\FolderC\FolderD\FolderE\

- C̣n các Folder/file đặt theo Cvnss4.0 th́ rất tuyệt, bởi dữ liệu của bạn chỉ bạn biết nếu như người đó không biết về Cvnss4.0.

Trên đây tiện ích nhỏ Cvnss4.0 mang lại, thể tính riêng rất cao, hạn chế rủi ro lộ thông tin không cần thiết. Nếu thêm vài cái pass từ Cvnss4.0 lên Floder nữa th́ đúng chỉ bạn hiểu những ḿnh lưu trữ quản các dữ liệu trong máy tính của bạn thôi.

Long Ngo

Nguồn: https://www.facebook.com/groups/toiyeuchuviet4.0/posts/861572345256881/

-------------------

 

BÀI 13: CHỮ VN SONG SONG 4.0 DƯỚI GÓC NH̀N MĂ HÓA

(ngày 6-1-2023)

Người đă sáng chế ra cách hóa Caesar thú vị vị hoàng đế Julius Caesar. Kỹ thuật này đă được phát triển vào khoảng năm 100 Trước Công nguyên. Hoàng đế Caesar đă dùng để gửi những mệnh lệnh quan trọng cho những tướng trên chiến trường. Do đó, nếu bọn giặc bắt được người truyền tin th́ cũng không thể đọc hiểu được nội dung của bức thư hóa đó.

Kiến thức này thật sự rất hữu ích được áp dụng cho tới ngày hôm nay. Nhiều người cho rằng, CVNSS4.0 giống chữ hóa hơn. Tôi nghĩ c̣n hơn thế nhưng hăy từ từ khám phá.

1. Nên hiểu ba thuật ngữ: Hashing, Encryption, Encoding

Hash một chuỗi được tạo ra thông qua một thuật toán, để bảo vệ tính toàn vẹn của dữ liệu. Điều đặc biệt không thể lấy được giá trị đầu vào sau khi chuyển đổi.

VD: user -> pass -> server [salted password -> hash] = database. Nếu khớp lệnh user mới truy cập được.

Encryption quá tŕnh chuyển đổi dữ liệu thành một định dạng không thể đọc được để giữ an toàn bảo mật cho chúng, chỉ những người được ủy quyền mới thể đảo ngược .

VD: Blockchain sẽ “Public key” “Private key”. Khi dữ liệu được gửi qua HTTPS, sẽ được hóa bằng public key, khóa này được lưu trữ trong tŕnh duyệt. Private key chỉ bên nhận dữ liệu sở hữu phải được giữ mật. Quá tŕnh này SSL handshake – xác thực server khi connecting với client, symmetric encryption sẽ đảm nhận việc hóa dữ liệu.

Encoding một quá tŕnh thay đổi dữ liệu sang một định dạng mới thông qua một lược đồ sẵn, công khai. Không yêu cầu khóa chỉ cầnbạn học , biết, hiểu đă hóa rồi tự ḿnh giải . Để đảm bảo dữ liệu được toàn vẹn thể được sử dụng bởi nhiều hệ thống th́ chỉ cần tối thiểu 2 người hoặc một nhóm người hiểu biết về . Nguyên này cũng dựa trên một dụ đơn giản thường thấy trong công nghệ thông tin như các thuật toán cho encoding: Base64, ngoài ra ASCII, Unicode, URL Encoding…

dụ: Mật Caesar một dạng mật thay thế, trong đó mỗi tựvăn bản ban đầu sẽ được thay thế bằng một tự khác, vị trí cách một khoảng xác định trong bảng chữ cái. Nếu chúng ta chuyển mỗi chữ cái theo ba vị trí sang bên phải, th́ mỗi chữ cái trong văn bản gốc của chúng ta sẽ được thay thế bằng một chữ cái sau ba vị trí bên phải.

Chẳng hạn, với văn bản “HELLO WORLD” bằng cách sử dụng dịch chuyển sang phải 3, chữ H sẽ được thay thế bằng K, E sẽ được thay thế bằng H, ... thông điệp được hóa cuối cùng cho HELLO WORLD sẽ KHOOR ZRUOG. Bạn thể thấy thông điệp này nh́n như: nghĩa, phải không? Đây chính ư nghĩa của việc hóa, biến một văn bản đọc được bằng mắt thường thành một văn bản nghĩa trong mắt con người nhưng đằng sau đó tưởng chừng nghĩa lại ư nghĩa quan trọng tùy theo mục đích sử dụng .

2. Hiểu CVNSS4.0 đơn giản như Encoding

CVNSS4.0 hiểu một cách đơn giản th́ Encoding thể h́nh dung như bạn học Mật Caesar. Việc này rất quan trọng hoá vai tṛ quan trọng trong giao dịch điện tử để đảm bảo độ bảo mật, toàn vẹn của thông tin khi truyền trên mạng. Hăy thử tưởng tượng các bạn muốn kể một câu chuyện mật cho người bạn thân của ḿnh. Để bảo mật câu chuyện riêng không bị lộ ra ngoài bạn sẽ cần dùng đến CVNSS4.0

Cũng giống như các loại mật thay thế khác, CVNSS4.0 vẻ giống ư tưởng mật Caesar bạn nghĩ vậy không? Bạn hăy tôi biết ư kiến của ḿnh! Càng t́m hiểu sâu về CVNSS4.0 bạn sẽ t́m thấy nhiều điều thú vị không chỉ con chữ ngôn ngữ đâu nhé!

Long Ngo

Nguồn: https://www.facebook.com/groups/toiyeuchuviet4.0/posts/919081789505936/

-------------------

 

BÀI 14: NHỮNG CHỮ CÁI DÙNG "LẬU"

(ngày 7-1-2023)

4 chữ F, J, W Z không trong bảng cái tiếng Việt lại được sử dụng thường xuyên ngày càng phổ biến.

******

1. Nhóm tự f, j, w, z cách viết tắt

Sinh thời, Cụ Hồ người rất quan tâm đến việc sử dụng bảo vệ tiếng Việt. Người thường nhắc nhở mọi người phải biết giữ ǵn quư trọng tiếng Việt. Ngôn ngữ do Người sử dụng giờ ta so sánh đối chiếu lại sẽ thấy rất uyển chuyển, linh hoạt, đảm bảo sự trong sáng của ngôn từ, tính chính xác cao, sức truyền tải lớn, phù hợp với từng đối tượng hướng tới. Người cũng từng nói việc dùng chữ viết theo cách riêng của ḿnh nhưng điều này không làm thay đổi chữ cái tiếng Việt.

dụ: CuốnĐường Kách mệnh” (1927) bảo vật quốc gia, chữ K thay chữ C.

Hay như, Bản Di Chúc của Hồ Chí Minh h́nh của chính tả viết theo ư ḿnh thích, được Người soạn thảo, viết từ năm 1965 đến năm 1969. Chưa vội bàn đến nội dung di chúc, về h́nh thức trong văn viết Người thường sử dụng "d" thay "đ", "f" thay "ph", "k" thay "c", "z" thay "d",”gi”, “ng” thayngh, nhưng ai nói Người viết sai chính tả hay viết tắt cực đoan chứ (?). Nếu nghiên cứu sâu sẽ thấy cách viết của Người.

(i) không viết dấu sắccác từ tận cùng bằng c, ch, p, t (tắc âm),

(ii) Không viết đủ chữ, viết tắt rất nhiều bằng việc tinh gọn con chữ.

2. Bảng chữ cái hiện nay bất cập

Bảng chữ cái Latinh hệ thống chữ viết dùng bảng chữ cái tiếng Anh gồm 26 tự được sắp xếp theo thứ từ A đến Z được sử dụng rộng răi nhất hiện nay trên thế giới.

Bảng chữ cái Latinh = Bảng chữ cái tiếng Việt + (F, J, W, Z) – (Ă, Â, Đ, Ê, Ơ, Ô, Ư)

Chữ Quốc Ngữ một loại chữ viết tiếng Việt, được ghi bằng tập hợp các chữ cái Latinh (nhưng loại bỏ nhóm tự: F, J, W, Z) dấu phụ được dùng cùng với các chữ cái đó.

Bảng chữ cái tiếng Việt = Bảng chữ cái Latinh – (F, J, W, Z) + (Ă, Â, Đ, Ê, Ơ, Ô, Ư) + thanh điệu

Chữ VN Song Song 4.0 được ghi bằng tập hợp các chữ cái Latinh (thêm vào nhóm tự F, J, W, Z) loại dấu phụ được dùng cùng với các chữ cái đó.

Bảng chữ cái VN Song Song 4.0 = Bảng chữ cái Latinh – (Ă, Â, Đ, Ê, Ơ, Ô, Ư) - thanh điệu

Như vậy, chữ viết của Việt Nam hiện nay được sáng tạo trên việc sử dụng tự Latinh để ghi âm tiếng Việt nhưng đă phức tạp hóa bằngcác chữ képthay thế cho “nhóm tự F, J, W, Z” khiến cho tiếng Việt khó ḥa nhập quốc tế. t́nh chúng ta sử dụng nhóm tự F, J, W, Z hiện nay đang dùng lậu theo quy định pháp  nhóm tự F, J, W, Z nằm ngoài bảng chữ cái tiếng Việt.

nhiên, nhưng ai đang sử dụng máy tính th́ các tự trên F, J, W, Z đă trở nên quen thuộc, chủ yếu phục vụ việc các tự riêng của tiếng Việt ă, â, đ, ê, ơ, ư. vậy, việc thừa nhận nhóm tự F, J, W, Z trên trong bảng chữ cái tiếng Việt điều cần thiết để thống nhất sử dụng về chuẩn chính tả tiếng Việt trên môi trường máy tính nếu tăng lên 33 tự trong sách giáo khoa th́ bảng chữ cái tiếng Việt hiện nay tổng cộng 29 chữ cái được sắp xếp theo thứ tự như sau: a, ă, â, b, c, d, đ, e, ê, g, h, i, k l, m, n, o, ô, ơ, p, q, r, s, t, u, ư, v, x, y sẽ thêm nhóm tự f, j, w, z.

3. sao phải bổ sung nhóm tự f, j, w, z

Trong luật hiện nay cũng nếu khá chủ doanh nghiệp cần đặc biệt lưu ư những hệ thống ngôn ngữ khác không phải hệ chữ La-tinh sẽ không được chấp nhận để đặt tên cho doanh nghiệp ( dụ hệ chữ viết mang tính tượng h́nh tượng thanh như Kana của Nhật, chữ Hán, chữRập... sẽ không được chấp nhận) (Theo Khoản 1, 2 Điều 39)”. Tên riêng được viết bằng các chữ cái trong bảng chữ cái tiếng Việt, các chữ F, J, Z, W, chữ số hiệu. (Theo Khoản 1, 2, 3 Điều 37).

Mặc , 4 chữ nói trên đă trở thành thông dụng trong tiếng Việt nhưng lại không trong bảng chữ cái, khiến cho việc sử dụng chúng trở thànhbất hợp pháp những chữngoài luồng”. Đây ràng một bất cập của bảng chữ cái hiện hành. Cho nên, việc bổ sung 4 chữ này vào bảng chữ cái không chỉ sẽ giải quyết được vấn đề đă nêu nhờ đó tầm phổ quát của bảng chữ cái sẽ được mở rộng đầy đủ, đáp ứng được sự phát triển của tiếng Việt hiện đại.

Tóm lại, CVNSS 4.0 chữ viết không dấu chỉ sử dụng 26 chữ cái Latinh trong đó dùng 18 chữ cái Latinh để thay thế dấu thanh dấu phụ cho CQN. biến đổi linh hoạt giữa các vần chữ Việt Nam sự luân chuyển giữa các diệu dấu, tạo ra chữ viết độ chính xác cao giúp người sử dụng nhận biết được mặt chữ đọc được, từ đây sẽ tạo ra kho dữ liệu về tên gọi hoặc các từ ngữ mới làm phong phú thêm hệ thống câu chữ tiếng Việt. Ước tính hiện nay ta khoảng 36.000 từ ngữ thông dụng th́ với CVNSS 4.0 một cách viết chữ song song với CQN, không ảnh hưởng đến CQN sẽ tạo nên từ ngữ gấp đôi.

Long Ngo

Nguồn: https://www.facebook.com/groups/toiyeuchuviet4.0/posts/919298829484232/

-------------------

 

BÀI 15: VŨ ĐIỆU CỦA NHỮNG CON CHỮ

(ngày 9-1-2023)

Khi bạn bước vào lớp 1, các bạn nhỏ (con em chúng ta) sẽ được học đánh vần theo bảng chữ cái với các chữ được phát âm như sau: a, bờ, cờ, dờ, đờ (...), gờ, hờ, (...) lờ, mờ, nờ, … Cho đến hết 29 chữ cái trong bảng chữ cái tiếng Việt. Ta vẫn gọi đó hệ thống chữ cái chính thức bảng chữ cái tiếng Việt (c̣n gọi tắt hệ thống chữ cái ABC).

Tuy nhiên, khi bạn xem chương tŕnh thời sự hay chương tŕnh bóng đá bạn sẽ thấy, người dẫn chương tŕnh hay b́nh luận viên sẽ đọc khác đi. dụ: nhóm nước G7, G8, G20... được các phát thanh viên Đài truyền h́nh trung ương (VTV) đọc gờ bảy”, “gờ tám”, “gờ hai mươi” hay như VTV lại đọc tên ”. Cụ thể, chữ tắt MC (người dẫn chương tŕnh) ta nghe đọc em xi”, sao không đọc Mờ Cờ” (?)

Đó , hệ thống tên chữ cái tiếng Việt của chúng ta hiện này tồn tại 3 hệ thống bao gồm:

1/ Hệ thống “a-bờ-cờ”, đây hệ thống do lịch sử để lại tồn tại từ phong trào b́nh dân học vụ sau Cách mạng T8/ 1945 để dạy cấp tốc đẩy lùigiặc dốt” qua các lớp họci tờ

2/ Hệ thống “a--c̣n hệ thống này vẫn dùng do tên chữ theo bảng chữ cái được giám mục Alexandre de Rhodes xác lập (hệ thống “a--”) đặc biệt sự hiện diện của người Pháp trên lănh thổ chúng ta một thời gian dài nên đă ăn sâu vào tiềm thức người dân.

3/ Hệ thống tên chữ cái tiếng Anh (“ây-bi-xi”), sau này khi chúng ta hội nhập th́ sự xâm nhập của tiếng Anh của giới trẻ làm cho hệ thống chữ cái tiếng Việt bị “Anh hóa”, nói khác đi khi một câu tiếng Việt chiếm đến 30% tiếng Anh.

Vậy làm cách nào để bảng chữ cái tiếng Việt chỉ c̣n một hệ thống tên chữ cái duy nhất áp dụngmọi lúc mọi nơi?

(i) Khi ta dùng hệ thống tên chữ để sử dụng khi đọc từng chữ cái riêng biệt ta dùng hệ thống “a--;

(ii) Khi ta dùng hệ thống âm của các chữ dùng để ghép vần, ta dùng hệ thống “a-bờ- cờ”;

(iii) C̣n hệ thống tên chữ cái tiếng Anh (“ây-bi-xi”) dùng khi nào bạn thích, kiểu như Vietlish cho sang, cho vẻ bạn người sính ngoại vậy.

Tới đây, ta lại phát sinh thêm một vấn đề vậy khi nào sự khác nhau giữa âm tên chữ cái?

Ta lấy dụ: chữ /r/ cách đọc [rờ] tuy nhiên cả ba miền Bắc Trung Nam điều đọc khác nhau. {dộn dàng}, {gộn gàng}, {rộn ràng} …

Qua đây, cho chúng ta thấy rằng, không nơi nào nói đúng hay chuẩn hoàn toàn nhưng chúng ta vẫn thể giao tiếp b́nh thường dựa trên câu chữ. Bản chất vấn đề nằmcách viết ngữ nghĩa như thế nào? Trong môi trường nào, phục vụ cho mục đích ?

Bản thân bảng chữ cái tiếng Việt vẫn tồn tại 3 hệ thống cách đọc khác nhau, bởi chúng ta bị nhầm tưởng cách đọc theo chữ, nên phát âm phải theo chữ t́nh ta coi một chữ chỉ một cách phát âm. Trong ngôn ngữ học th́ một chữ sẽ nhiều cách phát âm đó chính phương ngữ hoặc những chữ cách phát âm giống nhau nhưng cách viết khác nhau ...

Chữ VN song song 4.0 (CVNSS4.0) nhóm tác giả đă khẳng định không thay thế, cải tiến chỉ “song songvới Chữ Quốc Ngữ. sao ta không chịu chú ư vào phương pháp CVNSS4.0 chú ư vào nội dung bị thay đổi bởi điệu của những con chữ (?)

Long Ngo

Nguồn: https://www.facebook.com/groups/toiyeuchuviet4.0/posts/920597949354320/

-------------------

 

BÀI 16: CHỮ VN SONG SONG 4.0 TỪ ‘PHÁT KIẾN” ĐẾN SỰ H̀NH THÀNH GIẢ THUYẾT CHO BỘ CHỮ BILA

(ngày 22-3-2023)

Bộ chữ mới Bila này được đặt theo tên hai đồng tác giả Trần B́nh Kiều Trường Lâm. “Bila” ghép từ 2 chữ cái đầu tiên của chữ B́nh Lâm. Sau hơn 40 năm nghiên cứu về vấn đề cải tiến chữ Việt, hai tác giả đă phát kiến ra bộ chữ Chữ VN Song Song 4.0 (CVNSS4.0) [1] [2] [3] được công nhận bản quyền số 1850/2020/QTG.

Để ghi nhận sự đóng góp của họ, chúng tôi gọi bộ chữ CVNSS4.0 bộ chữ Bila”, tên tiếng Anh Bila Script Language (BSL) trong môi trường máy tính.

Xét về tính quyết định tương đối của ngôn ngữ chúng tôi cho rằng: ngôn ngữ chúng ta dùng sẽ ảnh hưởng đến cách chúng ta nghĩ, cách chúng ta quyết định một cách mặc định.

Khi “h́nh thức chữ viếtcủa một ngôn ngữmẹ đẻbị thay đổi về cách biểu hiện bên ngoài th́ sẽ xuất hiện những suy nghĩ định kiến trái chiều, không chấp nhận của cộng đồng nói ngôn ngữ đó.

Ngôn ngữ không tự nhiên sinh ra một sản phẩm của duy con người trong hoàn cảnh cụ thể, môi trường cụ thể cho từng mục đích nhất định. Mỗi ngôn ngữ được tạo dựng để phù hợp để thích ứng với một nền văn hóa riêng nhằm truyền tải đượcphần hồn của tiếng mẹ đẻtrong các môi trường vật lẫn phi vật , lớp vỏ bọc ngôn ngữ chỉ h́nh thức biểu hiện bên ngoài. Điều này, giúp chúng tôi nghiên cứu để củng cố hoàn thiệnGiả thuyết về sự phản kháng ngôn ngữ Bila”.

Nếu giả thuyết này phù hợp sẽ kiểm định được sự phản kháng thông qua Chữ Quốc Ngữ để đánh giá mức độ sàn sàng của mỗi nhân khi tham gia vào không gian mạng. Điều đó, nghĩa khi quyền riêng càng cao, tính phản kháng chấp nhận bảo toàn tính riêng được quan tâm nhiều liên quan đến việc lưu trữ, hiển thị cung cấp cho bên thứ ba thông tin liên quan đến bản thân thông qua Internet.

Điểm nhấn của ngôn ngữ Bila này, phương tiện truyền tải thông tin phi tập trung, nghĩa người nhắn tin lẫn nhận tin không c̣n phải phụ thuộc hay đặt niềm tin vào bất kỳ tổ chức trung gian nào để kiểm soát dữ liệu, nội dung họ trao đổi, thay vào đó họ thể trực tiếp giao dịch trực tiếp với nhau thông qua Cvnss4.0 (ngôn ngữ Bila), không sợ bị bên thứ ba nắm giữ sao chụp nếu họ không biết học Cvnss4.0 ngay từ đầu. Từ nền tảng ư tưởng này, giúp chúng ta thể tạo ra nhiều ứng dụng công nghệ nhằm hóa các giao dịch từ không gian mạng ra môi trường vật thực tế.

thể thấy, ảnh hưởng của ngôn ngữ Bila sẽ tác động đến cách hành xử của chúng ta khi ta tiếp cận thế giới trên không gian mạng. Điều này cũng giống như đặc điểm của phương tiện giao thông sẽ ảnh hưởng quyết định đến cách thức chúng ta tham gia giao thông, chứ không nhất thiết phải ảnh hưởng đến bản thân đối tượng hay địa điểm chúng ta muốn tiếp cận như thế nào. Ngôn ngữ Bila, vẫn sự phản kháng đối với ai không hiểu về Cvnss4.0 nhưng tương lai sẽ thành một quy tắc chung trong sự giao tiếp để bảo vệ riêng của mỗi nhân trên không gian mạng.

Tham khảo:

[1]  https://chuvietnhanh.sourceforge.net/ChuVietNhanhKieuChuVietCucNgan.htm

[2]  https://tinhte.vn/thread/co-duyen-nao-chu-vn-song-song-4-0-ra-doi-cach-day-vai-thang.3111004

[3]  https://chuvietnhanh.sourceforge.net/CongThucChuVNSongSong4.0VaViDu.htm

Long Ngo

Nguồn: https://www.facebook.com/groups/toiyeuchuviet4.0/posts/965641364849978/

-------------------

 

BÀI 17: GIÁ TRỊ TIẾNG VIỆT QUA CÁC MINH CHỨNG NGHIÊN CỨU. THÊM GÓC NH̀N TỪ CHỮ VN SONG SONG 4.0

(ngày 7-4-2023)

Chúng ta luôn bị giới hạn bởi việc năo bộ trong tiếp nhận xử thông tin nhanh, nhưng không bị giới hạn việc xử thông tin bằng khả năng nghe. Điều này, liên quan đến sự phát triển sinh học của bộ năo khả năng tiếp nhận của năo bộ thông qua thông tin lời nói. ta nói nhanh hay chậm th́ cũng đều tốc độ truyền dữ liệu nhanh nhất khoảng 39,15 bit/s (cao gấp 2 lần của Morse). Mặt khác, Tiếng Việt ta mật độ thông tin cao nhất trong 17 ngôn ngữ điều này rất thú vị cho sự phát triển của Chữ VN Song Song 4.0 (CVNSS4.0) trong tương lai. Bài phân tích dưới đây sẽ làm 2 luận điểm này:

1. Tốc độ truyền dữ liệu nhanh nhất

Nghiên cứu của nhóm Coupé et al., (2019) đă thực hiện nghiên cứutiếng Việt xếp đầu bảng với 8 bit cho mỗi âm tiết trong bảng xếp hạng của 17 ngôn ngữ được phân tích (h́nh 1).

Có thể là h́nh ảnh về văn bản cho biết '10- EUS ITA SPA CAT JPN HUN SRP YUE FRA KOR ENG DEU FIN CMN THA VIE 8- 000 YS . ·. … 6 සන eee .0 ” . ID Family Austroasiatic 8 Basque Indo-European Japanese Korean Tai-Kadai Sino-Tibetan Uralic Turkic'

H́nh 1. Tiếng Việt xếp đầu trong bảng xếp hạng 17 ngôn ngữ với 8 bit cho mỗi âm tiết.

Theo: Coupé, C., Oh, Y. M., Dediu, D., & Pellegrino, F. (2019). Different languages, similar encoding efficiency: Comparable information rates across the human communicative niche. Science advances, 5(9), eaaw2594. https://doi.org/10.1126/sciadv.aaw2594

Trong khi đó, tiếng Nhật, với chỉ 643 âm tiết, mật độ thông tin chỉ khoảng 5 bit cho mỗi âm tiết, tiếng Anh, với 6.949 âm tiết, mật độ thông tin chỉ hơn 7 bit cho mỗi âm tiết. Tiếng Việt dùng 6 dấu âm, cho phép ta nén thông tin cao nhất (so với Anh, Nhật, Nga...). Do mỗi âm tiết tiếng Việt chứa 8 bit thông tin, điều này đồng nghĩa với việc tiếng Việt truyền tải thông tin gấp đôi so với tiếng Nhật, chỉ cần nói với nửa tốc độ của tiếng Nhật th́ vẫn đạt được tương đương thông tin.

cũng ngoại ngữ khó học nhất do các thanh dấu tạo nên! dụ: chỉ cần đổi dấu... Dưa, Dứa, Dừa, Dữa, Dửa, Dựa thông tin thay đổi hoàn toàn. Trong khi đó, CVNSS4.0 trên môi trường máy tính sẽ Zuao, Zuax, Zuak, Zuaw, Zuav, Zuah sẽ không tốn nhiều Bit, như vậy giúp cho việc truyền dữ liệu tối ưu nhất.

dụ kế tiếp: Tiếng Việt chỉ cần 1 âm tiết "chào", tiếng Anh do đa âm tiết sẽ "hê-lô" (hello). Do đó để diễn đạt cùng 1 ư tứ nào đó tiếng Việt nghe rất ngắn gọn, súc tích, c̣n tiếng Anh sẽ nghe rất dài.

2. Mật độ thông tin cao nhất

Nghiên cứu của nhóm Pellegrino et al., (2011) đă thực hiện trên 7 ngôn ngữ khác nhau, bao gồm Anh, Đức, Pháp, Ư, Nhật, Quan Thoại (Trung Quốc), Tây Ban Nha với tiếng Việt được chọn làm điểm tham chiếu để so sánh với nhau. Kết quả cho thấy tiếng Việt mật độ (độ nén) thông tin cao nhất, đạt giá trị 1, trong khi các ngôn ngữ khác đều mật độ thông tin thấp hơn, dưới 2 (h́nh 2).

Có thể là h́nh ảnh về văn bản cho biết 'LANGUAGE INFORMATIONAL DENSITY SYLLABLE IDL INFORMATION RATE English RATE (#syl./s) 0.91 土0.04) French 6.19 土0.16) 0.74 土0.04) German 1.08 (土 0.08) 7.18 土0.12) 0.79 0.03) Italian 0.99 (土 0.09) 5.97 (土0.19) 0.72 0.04) Japanese 0.90 (土 0.07) 6.99 土0.23) 0.49 (土0.02) 0.96 Mandarin ±0.10) 7.84 0.94 =0.09) 0.04) 0.74 Spanish 0.06) 5.18 0.15) 0.63 土0.02) 0.94 Vietnamese 0.08) 7.82 0.16) (reference) 0.98 0.07) 5.22 0.08) (reference)'

H́nh 2. Tiếng Việt mật độ thông tin cao nhất trong 8 ngôn ngữ trong nghiên cứu.

Theo: Pellegrino, F., Coupé, C., & Marsico, E. (2011). Across-Language Perspective on Speech Information Rate. Language, 87, 539 - 558.

Các ngôn ngữ gần nhất về mật độ thông tin so với tiếng Việt tiếng Anh tiếng Quan Thoại. Điều đó, nghĩa Tiếng Việt ngôn ngữ giàu thông tin với 1 âm tiết chứa 8 bit thông tin, trong khi tiếng Anh th́ 1 âm tiết chỉ 7 bit thông tin, c̣n tiếng Nhật với 1 âm tiết chỉ 5 bit thông tin. Việc giữ được hồn của tiếng Việt với 6 thanh điệu trong môi trường máy tính, chứa được nhiều thông tin, cho thấy CVNSS4.0 đă hữu dụng.

3. Ứng dụng CVNSS4.0

Các nghiên cứu này một phát hiện thú vị, giúp chúng ta hiểu thêm về đặc điểm của tiếng Việt. Thông tin này cũng phần nào thể hiện được tính đọng, đơn giản của tiếng Việt, với khả năng truyền tải thông tin cao số lượng từ cần thiết để truyền tải ư nghĩa ít. CVNSS4.0 với nền tảng Chữ Quốc Ngữ trong sự phát kiến của nhóm tác giả Trần B́nh Kiều Trường Lâm (2020), đă tận dụng tính hiệu quả để tăng tốc độ xử nhằm truyền tải thông tin cao nhất trong mỗi âm tiết. Điều này giúp cho khả năng duy phát triển của người nói tiếng Việt, trong đó khả năng duy thể giúp rút ngắn truyền tải thông tin một cách hiệu quả.

4. Kết luận mở

CVNSS4.0 kiểu viết ngắn gọn để diễn ngôn cho tiếng Việt trong môi trường số, không dấu dấu thanh, chỉ dùng 26 chữ cái bảng chữ cái Latinh để hóa thông tin hiệu quả. Tiếng Việt ngôn ngữ dân tộc Việt từ thời Hùng Vương, vượt qua 1000 năm Bắc thuộc, phát triển đến ngôn ngữ đọng ngày nay. Dẫu trải qua nhiều giai đoạn lịch sử thăng trầm, qua nhiều hệ thống các hiệu để ghi lại ngôn ngữ khác nhau. Song Tiếng Việt tinh hoa, bản sắc linh hồn của văn hóa Việt, giúp dân tộc đứng vững măi măi sau này. Nghiên cứu các phương thức để phát huy các giá trị tiếng Việt nhắc nhở để hiểu giữ ǵn di sản to lớn này, góp phần làm giàu, phong phú ngôn ngữ của dân tộc khẳng định sức mạnh trên mọi môi trường.

-------

Note: ***Chương tŕnh dự án Chữ VN Song Song 4.0 (CVNSS4.0) do một nhóm tác giả người Việt yêu thích ngôn ngữ tiếng Việt, tạo lập một cộng đồng phi lợi nhuận xuyên quốc gia, nhằm thể hiện vai tṛ con người trong biểu đạt thông tin trên môi trường số thông qua việc khởi tạo triển khai ngôn ngữ Bila máy tính trên nền tảng CVNSS4.0 để bảo mật riêng , ẩn danh, phi tập trung trong lưu trữ. Chương tŕnh này hiện phát triển trên các ứng dụng nguồn mở miễn phí, kết hợp tính khả dụng của Chữ Quốc Ngữ tính không giới hạn của tiếng Việt, nhằm lan tỏa hiểu biết khoa học về ngôn ngữ với máy tính để bảo tồn tiếng nói, văn hóa Việt Nam trên không gian số.

5. Tài liệu tham khảo

- Coupé, C., Oh, Y. M., Dediu, D., & Pellegrino, F. (2019). Different languages, similar encoding efficiency: Comparable information rates across the human communicative niche. Science advances, 5(9), eaaw2594. Link <https://www.science.org/doi/10.1126/sciadv.aaw2594>

- Kieu-Tuong Lam, & Tran-Tu Binh. (2020). Typing CVNSS4.0 with EVKEY is a quick way to type Vietnamese characters on a computer (1.0). Zenodohttps://doi.org/10.5281/zenodo.7077573

- Pellegrino, F., Coupé, C., & Marsico, E. (2011). Across-Language Perspective on Speech Information Rate. Language, 87, 539 - 558. Link < https://www.jstor.org/stable/23011654>

 

Long Ngo

Nguồn: https://www.facebook.com/groups/toiyeuchuviet4.0/posts/974308747316573/

-------------------

 

BÀI 18: CHỮ VIỆT CỔ QUA LĂNG KÍNH CHỮ VN SONG SONG 4.0

(ngày 7-5-2023)

(Xin tặng file sách dành cho quư vị)

-------------------
Trong nhiều năm qua nhiều nhà nghiên cứu đă đi theo tiếng gọi quay về nơi viễn cổ thời Hùng Vương để nhặt cóp những vết tích đă phai ṃn theo thời gian bằng t́nh yêu ḷng tự tôn dân tộc, nhằm phục dựng lại những con chữ củangười Việt cổtừ hàng ngàn năm trước. Liệu rằng, t́nh yêu dân tộc ấy những nỗ lực không mệt mỏi dành cho ngôn ngữ, văn hóa, lịch sử thay thế được tính khoa học hay không (?) Bài viết dưới đây, sẽ làm hơn:

Các nhà nghiên cứu dựa vào cứ liệu khảo cổ, thư tịch cổ, kết hợp với điền cũng chỉ để chứng minh rằng:

(i) Chữ Việt cổ một thành tựu rực rỡ của văn minh thời Hùng Vương, không phảingụy trangbằng vỏ bọc bên ngoài dưới nhiều h́nh thức khác nhau, với tên gọi chữ khoa đẩu”. Cha đẻ của bộ sưu tậpchữ Việt cổđược khởi xướng nhà nghiên cứu Đỗ Văn Xuyền cùng sự ủng hộ của các nhà nghiên cứu khác với một niềm tin như thế[Dowload tài liệu] https://chuvietnhanh.sourceforge.net/CuocHanhTrinhDiTimChuVietCo.pdf

 

(ii) Nh́n vào hệ thống liệu, cách làm việc, thời gian nghiên cứu, cũng như nhiệt huyết của tác giả Đỗ Văn Xuyền, thể đây một nghiên cứu công phu tính liên ngành, đặc biệt tác giả sử dụng liệu khảo cổ kết hợp với văn tự cổ thư tịch cổ ngày nay chúng ta rất trân trọng.

Tuy nhiên, với luận thuyết phương pháp tạo ra CVNSS4.0 đă được nghiên cứu bị phản biện rất nhiều lần, chúng tôi cho rằngchữ khoa đẩurất mong manh về mặt khoa học bởi:

- Nhóm tác giả chữ việt cổ dùng các tự rất mờ nhạt để so sánh với chữ viết trên băi đá cổ Sapa dùng các luận điểm chủ quan về nền minh văn trên trống đồng, để xác lập được bảng chữ cái chữ Việt cổ dùng để ghi tiếng Việt của người Việt cổ. Bởi không thể nào từ xa xưa hơn 2000 năm trước bảng chữ cái lại đầy đủ số lượng phụ âm nguyên âm bản như Chữ Quốc Ngữ nhưng không dấu thanh. Bởi Chữ Quốc Ngữ chữ Việt cổ do ông giải cùng cấu trúc ghép vần tương tự nhau, chỉ khác nhau về h́nh dạng.

- Dựa vào tài liệuChữ Thái tổ tựcủa Phạm Thận Duật (Tri châu Điện Biên năm 1855) các chữ viết trong “Thanh Hóa quan phongcủa Vương Duy Trinh (1903), chúng tôi hoài nghi làm sao sự giống nhau về bộ chữ Thái Cổ hay do chính tác giả tạo ra trong thế kỷ XXI để mọi người tin rằng đó chính chữ Việt cổ đă tồn tại cách nay hơn 2 ngàn năm (?);

Hệ thống chữ viết CVNSS4.0 khi nghiên cứu đă được kiểm tra với tự của một dân tộc, tuân thủ các quy tắc, đó : (i) khả năng ghi lại được đầy đủ tiếng nói của dân tộc nào đó hay không? (ii) Thông qua, các đặc điểm của tự thể hiện được đặc điểm của ngôn ngữ dân tộc; (iii) khả năng ghi lại các sử kiện bằng phương pháp truyền khẩu dân gian. Do vậy, hành tŕnh việc t́m ra giải được chữ Việt cổ rất đáng trân trọng, ghi nhận bởi sáng tạo quá tŕnh không chỉ gian khổ c̣n khắc khổ. Phải cứ liệu khoa học sẵn sàng nhận lấy sự thẩm định, phản biện, thậm chí phê phán khắc khe của những người khác.

Long Ngo

Nguồn: https://www.facebook.com/groups/toiyeuchuviet4.0/posts/990535169027264/

-------------------

 

BÀI 19: MẠN ĐÀM VỀ THANH ĐIỆU TRONG TIẾNG VIỆT TỪ QUÁ KHỨ ĐẾN TƯƠNG LAI

(ngày 13-5-2023)

Chuyển đổi từ ngôn ngữ chưa thanh điệu sang 06 thanh điệu (?)

rất khó nói rằng một cách phát âm hiện nay từ đâu ra, sau hàng mấy trăm năm. Một trong những nguyên tắc làm việc bản của ngành ngôn ngữ học lịch sử Uniformitarian Principle (UP). Nguyên tắc này áp dụngmọi mặt khi nghiên cứu đó xem hiện tại ch́a khóa của quá khứ. Đây chính do dùng Chữ VN Song Song 4.0 (CVNSS4.0) với các thuyết phương pháp đă bị mổ xẻ để t́m lại các nhiều vấn đề trong quá khứ, chứ không chỉ đơn giản một công cụ để hóa.

Đầu tiên, giả thuyết về “nguồn gốc của thanh điệu của tiếng Việt hiện nay? Bằng hai bài báo năm 1953 năm 1954 của nhà ngôn ngữ học, nhân chủng địa người Pháp rất lỗi lạc đó André-Georges Haudricourt đă dập tắt những tranh luận nghi ngờ trước đây của các học giả Việt Nam, bị thuyết phục ngày nay được phần lớn các nhà ngôn ngữ học chấp nhận nguồn gốc của thanh điệu xuất phát từ Mon-Khmer khi nói đến tiếng Việt việc xếp tiếng Việt vào ḍng họ ngôn ngữ Nam Á chúng ta chấp nhập đến ngày nay của đến từ kiến giải. Ông đă chứng minh rằng tiếng Việt thuộc cùng họ với các ngôn ngữ Mon-Khmer  những tiếng không thanh điệu. Chính các tác giả hiện nay điều nhất trí trong quan niệm này đựa dựa trên luận điểm của Haudricourt, tin rằng tiếng Việt thuộc họ Nam Á, nhánh Mon-Khmer, chi Việt- Mường (!).

Như vậy, lịch sử h́nh thành thanh điệu của tiếng Việt từ không thanh điệu đến sáu thanh điệu như hiện nay thế nào?. Tiếng Việt hiện đại một ngôn ngữ thanh điệu, điều này cho thấy trong quá tŕnh lịch sử của ḿnhtiếng Việt đă biến đổi khá xa so với các ngôn ngữ Môn-Khmer cùng gốc ban đầu. Đây một vấn đề c̣n bỏ ngỏ cần được quan tâm nhiều hơn thêm khi đầy đủ liệu hơn.

(i) Từ không thanh điệu thành thanh điệu, vấn đề không chỉ nằmh́nh thức trong chính bộ máy phát âm của con người đă khả năng rất kỳ diệu để tạo ra nhiều âm thanh khác nhau, nhờ áp dụng các biện pháp ngữ âm phong phú này.

(ii) Việc chúng ta tin rằng tiếng Việt thuộc họ Nam Á, nhánh Mon-Khmer, nhưng chưa bao giờ chúng ta sự so sánh ngôn ngữ tiếng Việt với tiếng Môn liệu rằng thiếu sót hay không? Chúng tôi tin rằng, chữ Việt cổ thể một hệ chữ viết cổ nguồn gốc xuất phát từ chữ Brahmi tồn tại trên các hiệu trong văn hóa Đông Sơn, nhiên cần phải kiểm chứng nhiều hơn.

(iii) Nếu như ngữ điệu đặc trưng của câu, trọng âm đặc trưng của từ th́ thanh điệu đặc trưng của âm tiết. Với 6 thanh tiếng Việt: ngang, huyền, hỏi, ngă, sắc, nặng. Thanh được thể hiện trên chữ viết dấu thanh (c̣n gọi dấu). thanh điệu chính sức mạnh, đặc trưng quan trọng của tiếng Việt. Trong công thức CVNSS4.0 chúng tôi chỉ thay hiệu dấubằng chữ chữ cái, điều này không vi phạm quy tắc dấu c̣n gia tăng hiệu suất trong môi trường máy tính khi thể hiện văn phong tiếng Việt.

Từ thanh điệu sang ngữ điệu bị phương ngữ hóa

* Phương ngữ miền Bắc: Đầy đủ 6 thanh điệu của tiếng Việt. Nhiều địa phương không các âm vị phụ âm đầu /ʂ/, /ʈ/, /z/, /z̪/ (chính tả s, tr, gi r), tức không phân biệt s/x, tr/ch, d/gi/r. Ngoài ra c̣n lẫn lộn phụ âm /l/ /n/ (l n). Phân biệt ràng /v/ /z/ (v d). Không phân biệt các vần được thể hiện trong chính tả ưu/iu ươu/iêu. Đầy đủ phụ âm cuối.
* Phương ngữ miền Trung: Gồm 5 thanh, thanh hỏi thanh ngă bị lẫn lộn. Phụ âm đầu 3 phụ âm uốn lưỡi /ş/, /z̪/, // (tức s, r, tr). Nhiều thổ ngữ 2 phụ âm bật hơi [ph, kh] thay cho phụ âm /f/, /χ/ (ph kh) ở phương ngữ Bắc. Hệ thống nguyên âm đôi bị đơn hóa, trong chính tả ươ thành ư thành u. Phụ âm cuối, từ Thừa Thiên Huế đổ vào, sự biến đổi /-n/ sang /-ŋ/ (n sang ng) /-t/ sang /-k/ (t sang c).
* Phương ngữ miền Nam: Thanh điệu gồm 5 thanh, thanh hỏi ngă trùng làm một. các phụ âm uốn lưỡi /ş, /z̪/, / (s, r, tr). Thiếu phụ âm /v/, nhưng lại thêm âm [w]; âm [j] thay thế cho /z/. Âm đệm /-w-/ dần biến mất. dụ: “rốt cuộcbiến thànhrốt cục”. Đồng nhất các vần tương đương trong chính tả “in” vớiinh”, “it” với “ich”, “un” vớiung”, “utvới “uc”. m “iêuthànhiu”,oaithành “ai”.

(i) Mặc , thanh điệu đặc trưng quan trọng của tiếng Việt, nhưng đến từng địa phương, vùng miền đă bị địa phương hóa, điều đó sẽ tác động đến ngữ điệu riêng mang tính đặc thù. Nhưng khi thể hiện trên cùng một văn bản nhất máy tính ta cần phải tính nhất chung. Việc này không đơn giản bởi xử ngôn ngữ tiếng Việt rất khó khăn, hiện nay nhiều giải pháp CVNSS4.0 cũng một trong những giải pháp mang tính gợi mở để các chuyên gia ngôn ngữ lập tŕnh viên máy tính cùng ngồi lại với nhau.

(ii) Với nhiều cứ liệu thực nghiệm, các nghiên cứu này đă chỉ ra rằng vai tṛ của ngữ điệu trong các ngôn ngữ thanh điệu sẽ bị hạn chế rất nhiều so với ngữ điệu trong các ngôn ngữ không thanh điệu. Nhận định này đă từng được nêu lên trước đây nhưng đă không được chứng minh. Nhưng lẽ, khi xử tiếng Việt trên máy tính đă cho thấy điều đó.

Từ thanh điệu đến sự nhập nhằng trong xử tiếng Việt

Trong xu thế công nghệ 4.0 phát triển mạnh mẽ của AI, văn hóa Việt Nam phải được khẳng định ngay cả trên không gian mạng trong đó tiếng Việt nên những thay đổi phát triển không ngừng, CVNSS4.0 ra đời để hội nhập cho xu thế trên. Chính sự đa dạng, phong phú trong cách duy của người Việt, cách vận dụng đă tạo nên những đặc điểm гất riêng гất ít ngôn ngữ của dân tộc nào trên thế giới được. CVNSS4.0 nhằm khắc phục các nhược điểm đó để xử tiếng Việt trở nên tối ưu hơn. Một trong những hiện tượng tạo ra sựphức tạp rắc rốicủa tiếng Việt chính hiện tượng nhập nhằngnhư phân tíchtrên, đó hiện tượng khi nói hoặc viết những từ ngữ hồ không nghĩa hoặc nhiều nghĩa làm cho người đọc hoặc người nghe không phân biệt ràng, gây ra sự hiểu lầm.

CVNSS4.0 với tương lai về h́nh chatbot tiếng Việt phải được triển khai trên servers, trên cở hạ tầng do chính các tập đoàn/công ty lớn/tổ chức người Việt bảo mật kiểm soát. Trong trường hợp này liệu OpenAI làm không, chắc chắn làm được nhưng họ sẽ không làm bởi yếu tố nước ngoài! h́nh ngôn ngữ lớn tiếng Việt với vỏ bọc bảo mật CVNSS4.0 nếu tiếp theo được xây dựng trên LLaMA chẳng hạn độ tốt 90% so với ChatGPT sẽ bao gồm tiếng Việt, tiếng Anh các ngôn ngữ lập tŕnh khác cũng đă tốt rồi. Vậy CVNSS4.0 sẽ tiềm năng lớn khi tham gia vào h́nh ngôn ngữ lớn tiếng Việt được xây dựng cho riêng ḿnh, trong lĩnh vực nào đó như h́nh thành chữ viết riêng cho các dân tộc thiểu số chưa chữ viết, với khoảng 50 tỉ tham số (bằng 1/6 so với GPT-3 của OpenAI) cũng đă thành công rồi.

Tài liệu tham khảo:

  1. De l’origine des tons en vietnamien, Journal Asiatique 242: 69-82 (1954). Reprinted in Problèmes de phonologie diachronique: 146-160.
  2. La place du vietnamien dans les langues austroasiatiques, Bulletin de la Société de Linguistique de Paris 49(1): 122– 128.
  3. Mai, L. C. (2005) & Bảo, H. T. Về xử tiếng Việt trong công nghệ thông tin.

Long Ngo

Nguồn: https://www.facebook.com/groups/toiyeuchuviet4.0/posts/994070765340371/

 

+ NGUỒN: 19 BÀI VỀ CHỮ VIỆT THỜI CÔNG NGHỆ SỐ

https://www.facebook.com/groups/toiyeuchuviet4.0/user/1263501219

 

+  Ghi chú: Long Ngo (Ngô Hoàng Đại Long) hiện đang Nghiên cứu viên tại Phân hiệu Đại học Quốc gia-TP.HCM tại tỉnh Bến Tre, nhiều công tŕnh khoa họcđược công bố trên Scopus & WoSliên quan đến hướng nghiên cứu của ḿnh về Địa ngôn ngữ, nhất các Ứng dụng của xử ngôn ngữ tự nhiên (Natural Language Processing – NLP) trong GIScience.

(Facebook: Long Ngo https://www.facebook.com/dailong0606, Email: ngohoangdailong@gmail.com)

 

+ 19 bài này cũng được đăngPhụ Lục trong Giáo tŕnh Chữ VN Song Song 4.0:

https://chuvietnhanh.sourceforge.net/GiaoTrinhChuVNSongSong.htm

 

 

Về Trang Chính: Chữ Việt Nhanh

http://chuvietnhanh.sourceforge.net