
(ANS – Rôma) – Trong quá trình phát triển Tập san Salêdiêng Trực tuyến (BSOL), đã nảy sinh nhu cầu về một số công cụ hỗ trợ—một trong số đó là một công cụ tìm kiếm chuyên dụng. Đây chính là cách trang donbosco.info được hình thành.
Ý tưởng đằng sau công cụ tìm kiếm này bắt nguồn từ những hạn chế hiện hữu nơi các nguồn tài liệu Salêdiêng trực tuyến khác nhau. Mặc dù nhiều trang web cung cấp kho lưu trữ với chức năng tìm kiếm, chúng thường thất bại trong việc định vị tất cả các lần xuất hiện của từ khóa—do các giới hạn về kỹ thuật hoặc những hạn chế được thiết lập nhằm ngăn chặn tình trạng quá tải máy chủ.
Để khắc phục những thách thức này, thay vì xây dựng một kho lưu trữ tài liệu đơn giản với các tính năng tìm kiếm cơ bản, ban thực hiện dự án đã phát triển một công cụ tìm kiếm đầy đủ tính năng, hoàn chỉnh với cả khả năng đọc văn bản. Đây là một giải pháp mạnh mẽ, được vận hành bởi phần cứng chuyên dụng và phần mềm được thiết kế riêng.
Trong giai đoạn hoạch định, hai phương án đã được cân nhắc: một phần mềm cài đặt tại chỗ hoặc một ứng dụng trên nền tảng web. Xét vì sứ mệnh của BSOL là lan tỏa đặc sủng Salêdiêng đến càng nhiều người càng tốt, ban thực hiện đã chọn phương án web, cho phép bất kỳ ai cũng có thể tự do tìm kiếm và truy cập các tài liệu Salêdiêng.
Có thể truy cập công cụ tìm kiếm tại địa chỉ: www.donbosco.info
Giao diện web được thiết kế có chủ đích theo hướng tối giản và trực quan, nhằm tối ưu hóa tốc độ tải trang. Trang chủ liệt kê các tệp tin và thư mục hiện có, giúp việc duyệt tìm trở nên dễ dàng hơn. Các tài liệu không chỉ có sẵn bằng tiếng Ý mà còn bằng các ngôn ngữ khác, có thể được lựa chọn thông qua biểu tượng ở góc trên bên trái.
Hầu hết các tệp tin được tải lên đều ở định dạng PDF, được tạo ra thông qua quá trình quét OCR (Nhận dạng Ký tự Quang học). Do OCR không phải lúc nào cũng chính xác 100%, nên một số từ khóa có thể không được nhận diện. Để giải quyết vấn đề này, một số giải pháp thông minh đã được áp dụng: công cụ tìm kiếm bỏ qua dấu câu, các ký tự có dấu hoặc ký tự đặc biệt, và thậm chí có thể xử lý các ký tự bị thiếu hoặc không chính xác. Thông tin kỹ thuật chi tiết hơn có thể được tìm thấy trong mục Hỏi Đáp (FAQ) ở cuối trang.
Với số lượng tài liệu rất lớn hiện có, các tìm kiếm có thể trả về nhiều kết quả. Để thu hẹp phạm vi, người dùng có thể lọc theo thư mục, tiêu đề, tác giả hoặc năm xuất bản—và các bộ lọc này có thể được kết hợp để cho ra kết quả cụ thể hơn. Hệ thống xếp hạng kết quả tìm kiếm dựa trên mức độ liên quan, chủ yếu căn cứ vào mật độ và sự gần gũi của từ khóa trong văn bản.
Lý tưởng nhất, các tài liệu ở định dạng vector sẽ được ưu tiên hơn các tài liệu được quét, vì điều này sẽ đảm bảo kết quả tìm kiếm chính xác hơn và thời gian tải tệp tin nhanh hơn đáng kể.
Dự án đầy tham vọng và có ý nghĩa hết sức quan trọng này là một nguồn tài nguyên quý giá cho toàn thể thế giới Salêdiêng. Vì lý do này, Cha Andrei Munteanu, Giám đốc BSOL và là người thúc đẩy chính sáng kiến này, đang kêu gọi mọi người cùng đóng góp:
“Nếu quý vị có các tài liệu ở định dạng vector hoặc các phiên bản chất lượng tốt hơn những tài liệu hiện có trong công cụ tìm kiếm, quý vị có thể tải chúng lên thông qua dịch vụ tại www.donbosco.space.
Quý vị cũng có thể bổ sung các tài liệu mới chưa có trong hệ thống. Để nhận thông tin đăng nhập tải lên (tên người dùng và mật khẩu), xin vui lòng gửi yêu cầu qua email đến địa chỉ bsol@sdb.org.”
Ban Truyền Thông Chuyển ngữ