(trở về mục lục)

"Quan sát những điểm xanh" - Một cách nhìn mới vào Kinh tạng kỹ thuật số Phật giáo.

Howe Lan
Đề án bản đồ văn hóa điện tử (ECAI)
Viện Đại Học California, Berkeley

"Quan sát những điểm xanh" - Một cách nhìn mới vào Kinh tạng kỹ thuật số Phật giáo.

Howe Lan
Đề án bản đồ văn hóa điện tử (ECAI)
Viện Đại Học California, Berkeley

Giới thiệu:

Trải qua hơn hai ngàn năm lịch sử, tín ngưỡng Phật giáo đã ñöôïc truyền bá rộng rãi qua các bộ sưu tập phong phú bằng các dạng văn bản trên toàn thế giới.

Ngày nay, kỹ thuật hiện đại giúp cho xã hội bước vào thời đại công nghệ số. Cũng không ngoại lệ, tín ngưỡng Phật giáo và những nghiên cứu tương quan không cách nào khác phải thay đổi theo công nghệ mới của  kỷ nguyên.

(Chủ đề tín ngưỡng Phật Giáo)

Sau gần hai thập kỷ, với các nỗ lực cộng tác và sưu tập của toàn thế giới – như là Đề Án Văn Bản Phật Giáo Điện Tử (EBTI), một số lượng khổng lồ các văn tự Phật Giáo đã được số hóa, gồm cả Kinh tạng Phật Giáo chữ Hán, Pali, và Sanskrit đã làm một nền tảng mới cho những nghiên cứu và áp dụng Phật giáo ngày nay.  Đó là một bước tiến vĩ đại của lịch sử.

Những thử thách mới

Trong khi chúng ta đã có thể dể dàng truy nhập các văn tự Phật giáo phiên bản kỹ thuật số trên Internet, cùng với các catalogue mô tả chi tiết, định dạng kiểu mới vẫn chưa tạo nên sự thay đổi đáng kể nào trong lãnh vực nghiên cứu. Phiên bản trên mạng vẫn đang được sử dụng rộng rãi bởi nhiều học giả trên thế giới và nhận được hàng ngàn lượt truy tìm mỗi ngày. Những lượt truy tìm các đoạn ký tự cho phép người sử dụng tìm các thí dụ của một đoạn kinh hay tìm các danh mục cho các biến cố xảy ra. Thực là rất hữu ích, nó đã được người ta dùng như một công cụ nhanh lẹ hơn để tìm các tư liệu có mà trước đó chỉ có thể có được bằng cách quét scan từng trang tài liệu một.  Đã không có một cố gắng nào dùng định dạng số để phân tích các mẫu hình mà khó có thê nhận thức được bằng cách đọc hay viết ký tự.

(Thí dụ một đoạn truy tìm bằng Google với danh sách dài các kết quả của đoạn ký tự)

Chúng ta cần những phương cách mới để tận dụng các văn tự số.

Đề án “Điểm Xanh” của Đề Án Bản Ñoà Văn Hóa Điện Tử (ECAI), được hỗ trợ bởi Tổ Chức Khoa Học Quốc Gia (NSF) tài trợ, là một trong những nỗ lực tìm các phương pháp mới để thực hiện điều này.

Mô tả Đề Án

Sử dụng thuật ngữ trừu tượng ‘những điểm xanh’ thay vì những hình tượng chữ thật như là một phương tiện quan sát, đề án này đang cố phát hiện cách sử dụng của nó cho những tác vụ quan trọng nhằm phân tích cấu trúc chữ viết và mẫu hình cho các học giả của nhân loại. Đối với các dữ liệu thử nghiệm, chúng tôi dùng các phiên bản chữ viết số hóa của tam tạng Phật giáo tiếng Hàn. Đối với các dữ liệu phức hợp (metadata), chúng tôi dùng phiên bản số hóa của ông Lewis Lancaster Kinh Tạng Phật giáo tiếng Hàn: Một danh mục mô tả, đã được chuyển đổi bởi ông Charles Muller.

Phương cách này sẽ liên quan đến các tiến trình như sau:

(1) Chuyển đổi các ký tự chạm trổ được thể hiện bằng những font chữ thành hình thức các chấm màu sắc.

Chúng ta thấy ở đây một trong những bảng khắc gỗ của tạng kinh và trên đó là 23 hàng chứa 14 ký tự. Mỗi ký tự chứa một biểu hiện mã Unicode như sau:

Mỗi một ký tự trong bảng chạm này sẽ được chuyển đổi qua một chấm màu xanh lơ có cùng một dữ liệu liên kết (metadata) với bảng chạm.

Những chấm xanh lơ biểu diễn những ký tự chạm được sắp xếp theo thứ tự xuất hiện trên ‘các trang.’

Trong một phần mềm 3D, những điểm ảnh trừu tượng “điểm xanh” của Kinh tạng đã có thể truy xuất được theo một dạng đọc được cho người sử dụng hiện nay.

(2) Truy tìm những đoạn dữ liệu trong thể hiện các ‘điểm xanh’

Việc sử dụng các điểm xanh để tìm những mẫu hình có thể bắt đầu với một đoạn chữ (tương tự như Google search) của toàn bộ văn tự cần tìm.  Khi những ký tự cần tìm được tìm thấy, kết quả truy tìm có thể sau đó được gởi tiếp đến để thể hiện 3 chiều và được trình bày như những ‘ký hiệu’ trên những ‘trang’ theo kiểu điểm xanh của các từ đã tìm được thay đổi theo màu sắc và kích thước.

(3) Nhận dạng kết quả truy tìm các mô hình

Ở điểm này, người sử dụng có thể ‘thấy’ tất cả những chỗ mà đoạn chữ cần tìm được tìm thấy. Hơn là phải dò trực tiếp trên các bảng chạm khắc mà đã tạo nên phiên bảng được in ra, chúng tôi tiếp tục ở lại với khoảng làm việc trừu tượng này cho việc tìm tòi các mẩu hình về sau mà có thể thể hiện được bằng các hình ảnh. Khuôn mẫu đầu tiên có thể là một chùm chữ. Người sử dụng có thê xác định những nơi mà các chùm chữ đó hiện ra.

Khi ta so sánh với kết quả tìm kiếm của Google với những điểm ảnh chấm có màu, nó sẽ cho thấy rõ ràng những mẫu hình dễ dàng nhận ra ngay lập tức. Việc này có thể mất rất nhiều giờ cho các học giả nếu theo dò tìm chỉ bằng đoạn chữ và các ghi chú mà thôi

(4) Ngữ cảnh hóa kết quả dò tìm.

Với dạng dữ liệu phức hợp (dữ liệu của dữ liệu metadata) thể hiện bằng  những chấm, các chấm trừu tượng này có thể đưa vào một số dạng ngữ cảnh (Khi nào, Ở đâu, Ai, v.v…) để đánh giá.

Bước đầu tiên là chỉ ra những ‘trang’ thuộc về một trong số 1500 phân đoạn Kinh tạng.   Điều này cho phép người sử dụng thấy ngay những kết quả dò tìm khi chúng xuất hiện trong mỗi đoạn phân đoạn.

Sau đó, có nhiều phương pháp ngữ cảnh hóa để có thể nối kết các ‘trang’ này với nhau.

Muốn biết đoạn nào của Kinh tạng được dịch vào khoảng thế kỹ thứ 5 và 7?

Với dữ liệu phức hợp (metadata) có tương quan thời gian, những ‘trang’ được dịch trong khoảng thế kỷ thứ 5 và 7 có thể dể dàng được tìm thấy qua sắc màu đỏ.

Cũng tương tự, những “trang” này có thể được mang màu theo nơi mà chúng được dịch, nối liền với các tự viện và nơi chốn của chúng.

Tuy vậy, một thể hiện khác cũng có thể thực hiện để phân biệt tác giả của đoạn kinh, kết nối với người dịch và thông tin liên quan.

Như vậy, chúng ta cũng có thể nhận ra nếu một số từ ngữ nào dịch giả này dùng thường hay dùng nhưng các dịch giả khác thì không.

Hay chúng ta có thể nhận ra một cách dùng từ nào phổ biến hơn trong một thời gian nào đó.

Từ phương cách bên trên, người sử dụng có thể tìm một đoạn từ, nhận ra nó bằng những chấm mang màu sắc tương phản với màu xanh. Hình ảnh này cho phép học giả nhanh chóng thấy số lần lập lại và nơi đoạn từ đó phát sinh và cả toàn thể đoạn văn trong kinh điển.  Trong một số trường hợp, nó sẽ lập tức được thấy rõ rằng từ đó tìm thấy xuyên suốt đoạn kinh. Bằng cách dùng ngữ cảnh, nó cho ta thấy từ này được xuất hiện thường xuyên trong khoảng thế kỷ thứ 5 – thứ 7 và không thường xuyên vào thế kỷ thứ 9 - thứ 11.

Khuôn Mẫu của cấu trúc ngữ cảnh

Đối với những sử dụng phức tạp hơn kỹ thuật ‘điểm xanh’, chúng ta có thể chuyển qua cách dò tìm cấu trúc ngữ cảnh của mỗi đoạn trích.

(1) Bố cục vòng

Từ các nghiên cứu kinh tạng và cổ điển, chúng ta ý thức rằng nền văn học cổ xưa thể hiện cấu trúc hoán đổi, đó là, khi có một sự hoán đổi thứ tự của các từ.  Trong loại cấu trúc này, đoạn cuối cùng liên hệ tới đoạn đầu tiên. Nó có thể thể hiện là A B C D D’ C’ B’ A’.  Từ chỗ này, chúng ta có kiến trúc ‘vòng’ nơi câu chuyện bắt đầu, tiến dần đến một chỗ ngoặc, và sau đó lập lại các tiểu tiết trong câu chuyện đảo ngược lại cho tới khi người đọc đến cuối bài là nơi sẽ có một xác định tương tự hay liên quan đến đầu bài. Bộ sách vừa qua của Mary Douglas Suy tư về vòng lập: một tập thuyết theo bố cục vòng đã chỉ ra nhu cầu từ những nghiên cứu văn hóa liên quan chéo của một biến cố văn học đặc thù về cấu trúc hoán đổi này.

Dùng khả năng dò tìm của phiên bản số Kinh Tạng Phật giáo, chúng ta có thể bắt đầu tạo ra một ‘thể hiện điểm xanh’ mà bao gồm những nới mà cấu trúc vòng xuất hiện.

(2) Bố cục diễn dịch vòng

Vì bố cục vòng được kết hợp bằng một loạt từ ngữ, khái niệm, những vòng nhỏ hơn xuất hiện theo một tiến trình mà: ‘quay lại’ và tất cả những loạt từ này lập lại đảo ngược, chúng ta có thể tìm những từ cần theo nơi chốn trong một cấu trúc. Nếu một khái niệm xuất hiện như là một trong những từ chủ đề cho những mặt song song của vòng, nó cho chúng ta một cơ hội để xử lý những khái niệm về tương quan với các từ cùng chủ đề khác. Đó là, nếu chữ cần tìm là B trong dãy A B C D C’ B’ A’ trong một vòng đã nhận dạng, chúng ta có thể biết một từ đó có một tương quan đặc biệt với A, C và D.

Cấu trúc vòng có một điểm bắt đầu, một điểm quay lại, và điểm kết thúc.  Chúng ta có thể nhận dạng được điểm quay lại là chổ giữa hạng mục cuối cùng của dãy đầu tiên và sự lập lại của dãy thứ hai. Đó là chúng ta có A B C D (điểm quay lại) D’ C’ B’ A’. Điểm quay lại và nơi mà thông điệp chung của vòng được định vị. Trong không gian của D, chúng ta mong sẽ tìm được cái lõi của vòng.

Trong việc tìm một từ cần thiết, thật là rất trọng yếu để thấy chữ đó xuất hiện vị trí cốt lõi của cái vòng. Điều đó sẽ có trọng lượng hơn rất nhiều hơn là nó chỉ là một trong những bảng song song trong hệ thống. Bên dưới, chúng ta thấy hình ảnh nơi mà sự phân tích vị trí của từ cho ta thấy có khả năng có một bố cục vòng lớn và cũng tìm kiếm một nội dung hệ thống được lập lại. Nó có thể được đánh dấu như ở dưới đây với một chấm màu to lớn cho thấy lần lập lại đầu tiên của từ.  Những chấm vàng là những dấu hiệu mà chúng ta có một cấu trúc lập lại. Đây hẳn là điểm quay lại trong vòng tròn.

Tìm thấy một Bố Cục Vòng và điểm trở lại của từ cuối cùng trong dãy đầu tiên và cùng từ đó như là chữ đầu của dãy thứ hai, nó có thể được đánh dấu riêng ra những từ tạo ra điểm này. Trong một số trường hợp, điểm quay lại có thể chứa một kết quả một chú thích dài trong vòng bị ấn núp trong cung cách đọc bình thường.

Những cụm từ

Cụm từ thì hoàn toàn khác với sự xuất hiện của một từ cần tìm trong vòng một bố cục vòng. Khoảng cách giữa những sự xuất hiện các từ cần tìm thì được phần mềm dùng để nhận dạng một cụm từ. Để có thể hiểu được bản chất của cụm từ, thật là bức thiết để thấy một ngữ cảnh tần suất của từ cho nội dung đó.

Hiện tại, tần suất của từ thường được trình bày như là một liệt kê những từ chiếu theo mức độ của chúng trong liệt kê những số lần xảy ra.

Ở trong ‘Quan sát điểm xanh’, chúng ta có thể thấy tần suất bằng hình ảnh và điều này cho phép chúng ta hiểu rằng tổng số lần xuất hiện có thể không quan trọng bằng sự phân bố. Trong thí dụ tiếp theo, chúng ta thấy rằng cụm từ của từ cần tìm trong đoạn văn và sự vắng mặt của nó trong hầu hết các đoạn văn khác là một dấu hiệu cho thấy sự sử dụng từ đó trong cấu trúc vi mô.

Một số lợi ích

Sử dụng mô hình ‘Quan sát điểm xanh’ trừu tượng này trong việc tìm kiếm đoạn chữ, cụm tù, phân tích Kiến Trúc Vòng, quan sát kết quả qua thời gian, người sáng tạo nó, và nơi chốn sẽ cung cấp việc nghiên cứu kinh văn theo một cách thức mới.

(1) Quan sát kết quả dò tìm trong các hình ảnh trừu tượng cho phép người sử dụng xác định nhanh chóng các mẫu hình bằng hình ảnh số lần xảy ra của những từ cần tìm. Thấy hình ảnh của kết quả thay vì vài trăm hàng chữ dằng dạc của Google Search sẽ là một cải tiến cần thiết. Khi làm việc với chỉ mục bằng chữ của không gian chứa chữ cần tìm, nó sẽ làm các học giả mất nhiều giờ đồng hồ hay thậm chí cả tuần để tìm ra các mẫu hình sự phân bố khi mà việc dò tìm mang kết quả chứa hàng trăm thí dụ rải rác khắp nơi trong hàng ngàn trang văn tự. Một số mẫu hình của việc phân bố này thì có sẳn ngay tức thì khi kết quả dò tìm là hình ảnh.

(2) Sau khi nhận được dữ liệu theo sự xuất hiện của một chuỗi ký tự, yêu cầu của nhà học giả là hiểu những từ đó trong vòng một số ngữ cảnh khác nhau.

Thí dụ: một đoạn từ nào đó chứa danh mục của 1500 kinh tạng; thời gian kinh được dịch; sự tương quan của tất cả các đoạn kinh mà được tạo ra bởi một cùng một vị; nơi mà việc dịch nghĩa đã hoàn thành.

Vì rằng nó có thể thay đổi hình ảnh hiển thị để thấy rõ kết quả nghiên cứu trong tất cả những ngữ cảnh này, các nhà nghiên cứu sẽ có được sự hướng dẫn nhanh trên hàng loạt từ sắp xếp theo ý nghiã.      

(3) Sự trừu tượng của định dạng ‘điểm xanh’ cung cấp những phương pháp mới để tìm tòi cho từng kết quả dò tìm. Người sử dụng có thể nhận ra bằng hình ảnh những mẫu hình của vị trí, tương quan, độ dày đặc, và tần suất cho thấy những kết quả sẽ không đạt được nếu tìm bằng những phương cách thông thường. Bởi vì phương pháp xem dữ liệu được mở rộng, các phản ứng và hồi đáp của người sử dụng có thể được nhân lên nhiều lần vượt khỏi giới hạn của việc thu nhận dử liệu kiểu các dòng chữ mô tả. 

(4) Hiện nay, việc dò tìm một chuỗi từ trong dữ liệu kinh tạng chỉ nhận được một sự xác định vị trí với một vài dữ liệu phức hợp kết nối vào. Dùng cách dò tìm “Quan Sát Điểm Xanh”, chuỗi từ xuất hiện theo một cảnh quan cho phép người sử dụng ghi nhận cả sự hiện diện cũng như sự vắng mặt của nó. “Vật chấm đen” của sự thiếu vắng thường định nghĩa các mẫu hình thật rõ ràng như sự “hiện diện”. Với kết quả dò tìm thể hiện trong đoạn từ, chúng ta không có cảm giác về vị trí nơi nó vắng mặt.

(5) Nhận ra một cụm từ của chuỗi từ cần tìm thật là quan trọng cho việc hiểu rõ sự phân bố của nó. Có thể rằng đã có 1.000 thí dụ của các từ cần tìm, nhưng độ dày đặc của hình ảnh có thể cho thấy phần lớn của chúng xuất hiện trong một đoạn kinh hay trong một lúc nào đó trong một thời kỳ hay trong các công trình của các dịch giả. Sự dày đặc như vậy thật là khác biệt từ một tình trạng mà các cụm từ xuất hiện khắp toàn kinh tạng. Hình ảnh cho thấy sự nhận dạng tức khắc bản chất của sự phân bố này.

(6) Nghiên cứu về bố cục vòng đã được xác nhận và dùng trong các môn học Kinh tạng và cổ điển. Độc đáo của ‘vòng’ này là việc các từ xuất hiện trong nhiều phần khác nhau của cấu trúc có những chức năng khác biệt. Đã có hai công trình song song về các nhóm nghĩa từ đã xuất hiện theo một trật tự và sau đó đảo theo hướng ngược lại. Nếu một từ cần tìm xuất hiện giữa những nhóm nghĩa từ thì nó cho một sự xác định cách mà nó đã kết hợp với các ý tưởng khác thế nào. Mặt khác, nếu nhóm nghĩa từ xuất hiện như một ‘lõi’ của ‘vòng’, thì đó là điềm đảo lại giữa hai công trình song song, nó sẽ có chức năng khác mà một trong số đó được dùng trong 2 cấu trúc phản hồi.

(7) Một khi các mẫu hình được phát hiện qua kỹ thuật ‘Điểm Xanh’ trừu tượng, học giả có thể thấy các tác phẩm chạm khắc và nghiên cứu bản viết chữ của đoạn kinh. Nó có thể sẽ được chuyển tới chuyển lui từ hình ảnh của bản chạm khắc qua ‘Quan Sát Điểm Xanh’ để ngữ cảnh và mẫu hình bằng hình ảnh.

(8) Kết luận qua thí dụ ở trên, nhà học giả sẽ có thể cho thấy ngữ cảnh của nhóm nghĩa từ, nơi có một tần suất cao, nơi nó là trung tâm của Cấu Trúc Vòng, nơi nó được tương quan với các từ khác, khi mà mỗi cái trong số các mẫu hình được tìm ra theo nghĩa sự sáng tạo của tư liệu, nơi mà tư liệu được tạo ra từ gốc v.v…  Thấy một từ trong tất cả việc ngữ cảnh hóa có thể cho phép nhà nghiên cứu khả năng diển tả được ý nghĩa, thấy các cấu trúc nằm bên dưới của đoạn từ (vượt qua khỏi cả chương, trang, phân đoạn), và xác định sự rõ ràng của từ cần tìm trong tất cả các choã của nó.

Sử dụng những phương cách mới như ‘Quan Sát Điểm Xanh’ các kinh tạng Phật Giáo, chúng ta có thể mong đợi định dạng kiểu số cuối cùng sẽ phá vỡ những biên giới của cách thực hiện thông thường của ta và cho phép ta tìm tòi những chân trời của tiềm năng ẩn mình trong kỹ thuật kiểu số mới mẻ này.

Tài liệu tham khảo:

  1. Viện nghiên cứu tam tạng Kinh Điển Triều Tiên, Tam Tạng Kinh Điển Triều Tiên Số Hóa, 2002.
  2. Lewis Lancaster, Kinh Phật Giáo Triều Tiên: Một Sưu Tập Ý Nghĩa, phiên bản số, www.acmuller.net/descriptive catalogue.
  3. Hội Kinh Tạng Phật Giáo Trung Quốc, CBETA Kinh Phật Giáo Số Hóa, ww.cbeta, org.
  4. Mary Douglas, Suy nghĩ về Vòng Tròn: Một tiểu luận về Cấu Trúc Vòng, Đại học Yale, 2007
  5. Edit: Tâm Hương