(trở về mục lục)

Những thành tựu và thách thức

HWANG, Soonil
Dongguk University, Seoul, Korea
Mai Bình Phương dịch

Cuộc gặp gỡ nhỏ mà đã đánh dấu cái được gọi là sáng kiến Sách Phật Giáo Điện tử (EBTI) năm 1992 đã làm chuyển đổi các nghiên cứu về Phật giáo Đông Á từ Analogue đến thời đại kỹ thuật số. Các học giả ngày nay không còn bị phụ thuộc nhiều vào những quyển kinh Phật được in dày hàng tập nữa, như Đại Chánh Tân Tu Đại Tạng Kinh (Taishō Dhinshū Dai Zōkyō) chẳng hạn, thay vào đó họ sử dụng máy vi tính hay kết nối vào mạng Internet hoặc dùng các CD-Rom. Trên thực tế, toàn bộ các quyển kinh trong Đại Chánh Tạng (Taishō) đều đã được đưa lên mạng và có CD-ROM, được cung cấp bởi Trung Hoa Phật học Điện tử Hiệp Hội (CBETA), trong khi toàn bộ các quyển kinh của Goryeo Daejanggyeong cũng được Viện Nghiên Cứu Tam Tạng Kinh Điển Hàn Quốc (RITK) cập nhật lên mạng.  SAT (Saṃgaṇikīkṛtaṃ Taiśotripiṭakaṃ) ở Nhật cũng cố gắng cung cấp nhiều hơn các bản dịch kỹ thuật số đáng tin cậy Đại Chánh Tạng. Với sự hỗ trợ của các bản văn điện tử này chúng ta không những có thể truy cập những thuật ngữ đặc biệt trong kinh Phật nguyên tác mà còn có thể so sánh với các đoạn văn có nội dung tương tự ở các bản dịch khác nhau. Các học giả và người nghiên cứu trích ra các đoạn từ văn bản điện tử trong bản văn được cung cấp lần đầu tiên bởi CBETA năm 1998.

Mặc dù những bài kinh Phật kỹ thuật số đã tạo nên một cuộc cách mạng trong việc giúp người ta tiếp cận với Phật giáo nhanh hơn, vẫn còn vô số vấn đề và giới hạn trong việc sử dụng nó. Trước hết, những văn bản này không được uy tín như bản in chính gốc bởi những lỗi rải rác so với nguyên tác.  Ví dụ như CBETA và Tripitaka Koreana đã được kỹ thuật hóa lên máy vi tính nhờ chương trình nhận biết ký tự bằng quang học (OCR).  Mặc dù công cụ này có thể tăng nhanh tốc độ kỹ thuật hóa thủ tục nhưng nó không thể đảm bảo độ chính xác của văn bản khi số hóa.  Cả CBETA và RITK đều nỗ lực hết sức để sửa những lỗi sai đó nhưng vẫn còn khá nhiều lỗi được phát hiện so với nguyên tác.  Đó có thể là một trong những lý do tại sao SAT ở Nhật đã bắt đầu công cuộc số hóa của họ với Đại Chánh Tạng. Việc này cho thấy rằng, chúng ta vẫn đang ở trong giai đoạn đi tạo dựng sự tin cậy và chính xác cho việc số hóa Kinh Phật.

Điều thứ hai, các lỗi có thể xuất hiện trong khi đang tra cứu kinh sách Phật giáo kỹ thuật số vì lý do sai Tagging. Trước khi lưu vào cơ sở dữ liệu, những văn bản Phật pháp được số hóa thường được đính kèm khổ  XML nhằm sắp xếp các thông tin quan trọng, ví dụ như số trang, số cột, số hàng. Tagging còn dùng để hiển thị các chữ bị mất, những chữ mà không xuất hiện trong tiêu chuẩn của trang web vì giới hạn các ký tự Trung Quốc khi dùng phông chữ Unicode. Trong cả hai trường hợp, những lỗi do người sử dụng mắc phải không thể khắc phục được kết quả tìm kiếm và hiển thị sai các chữ bị mất. Những vấn đề như vậy đã được cả người cung cấp và sử dụng dịch vụ báo cáo và khắc phục. Mặc dù cả CBETA và RITK đều vẫn đang tiếp tục cố gắng song vẫn còn khá nhiều lỗi được phát hiện trên mạng và cả trong các CD-ROM.

Thứ ba, có những giới hạn trong việc kỹ thuật số các văn bản Phật pháp đã được sử dụng như tài liệu tham khảo có tính học thuật. Mặc dù chúng ta tra cứu các từ và đoạn văn từ e-texts, chúng ta vẫn sử dụng cả các trang, cột, hàng của bản Đại Chánh in.  Những vấn đề tương tự cũng xảy ra khi sử dụng CD-ROM Phật học Pali, như là phục hồi tài liệu Kinh Phật [(BUDSIR) (Buddhist Scriptures Information Retrieval)] và Chattha Sangayana.  Mặc dù khi tra cứu từ hay cụm từ và trích dẫn ra đoạn văn từ các CD-ROM nói trên chúng ta vẫn dùng số cột, trang, hàng của Hội Văn bản Pali (PTS) trong bản in.  Thực tế, tiêu chuẩn kỹ thuật hóa kinh Phật có thể được đánh giá không chỉ như nguồn tài liệu tin cậy cho tham khảo có tính học thuật và nguồn tài liệu tham khảo phong phú mà còn tiện dụng như là một công cụ để truy cứu và trích dẫn kinh Phật. Điều đó có nghĩa là tiêu chuẩn kỹ thuật hóa kinh Phật dù sao cũng chưa thể thay thế hoàn toàn kinh Phật nguyên tác truyền thống. Cuối cùng, có những vấn đề tương thích giữa các bản dịch kinh Phật đã được kỹ thuật hóa. Trong thời gian ban đầu, EBTI chưa bao giờ định dạng một sự quản lý tập trung nào. Mỗi nhóm và mỗi người phát triển khác nhau làm việc độc lập nhằm đưa ra các sáng kiến khác nhau để số hóa kinh Phật cho kịp với tốc độ phát triển của xã hội đương thời.

Từ quan điểm ban đầu của người phát triển, rất nhiều chương trình khác nhau đã được sử dụng, phát triển từ giáo trình gốc. Từ ý kiến của người sử dụng, hàng loạt phần mềm khác nhau đã đưa vào khai thác, các ngôn ngữ hệ điều hành (OS) như Window và Mac, và cả những hỗ trợ đặc biệt khác. Một trong những vấn đề nghiêm trọng nhất của sự tương thích là làm thế nào để liên hệ với những ký tự không hiển thị, không xuất hiện trên Internet từ đó giới hạn con số ký tự Trung Quốc trong phông chữ Unicode. Mặc dù các nhóm của EBTI sử dụng Unicode để hiển thị phông chữ Trung Quốc, mỗi đội phải phát triển và cập nhật nó thương xuyên thông qua rút kinh nghiệm trong xử lý các ký tự bị ẩn đi này.

Dù cho phông chữ đặc biệt của TFT gọi là Mojikyo có thể dùng để xem và in những ký tự ẩn thông qua các Word Processos khác nhau, nó không thể dùng với những trang web cơ bản. Đó có thể là một trong các lí do tại sao một vài nhóm sử dụng bitmap image files (đính kèm ảnh nhỏ) để hiển thị chữ Hoa ẩn. Ví dụ như EBTI ở đại học Dongguk, Seul, đã dùng biện pháp này cho trình duyệt web của mình. Bằng cách này các ký tự ẩn được lưu lại như một file ảnh nhỏ đơn giản và xuất hiện trên trang Web như XML format thông qua một tagging đặc biệt. CBETA cũng phát triển giải pháp theo cách của họ, để chỉ ra chữ ẩn họ dùng dấu các ngoặc đơn trong phạm vi của Unicode. Kết quả là, không có sự tương thích nào trong việc ẩn chữ giữa các văn bản số hóa với e-text.

Giờ thì làm sao chúng ta có thể giải quyết những vấn đề trên và các giới hạn?  Làm sao để những văn bản số hóa có thể thay thế nguyên tác truyền thống?  Làm sao để dễ dàng chia sẻ những kết quả trên cho sự phát triển một cách độc lập thông qua các nhóm trong EBTI?  Làm sao chúng ta có thể chắc chắn được về sự tương thích giữa các loại e-text?  Đó chính là những vấn đề tôi muốn đặt ra để giải quyết trong bài này.