Thư Viện Tài Liệu Tổng Hợp

TaiLieuTongHop.Com - Kho tài liệu tổng hợp hoàn toàn miễn phí dành cho mọi người

Hãy sử dụng chức năng tìm kiếm bên dưới để tìm tài liệu trước khi post yêu cầu liên diễn đàn!

Loading

VanMau.VN - Thư viện văn mẫu Việt Nam
+ Viết bài mới  + Trả lời bài viết
 
LinkBack Ðiều Chỉnh Xếp Bài
  #1  
Old 08-25-2013, 11:52 PM
Senior Member
 
Tham gia: Jun 2013
Nơi Cư Ngụ: Văn Lâm - Hưng Yên
Tổng số bài gởi: 1,606
Send a message via Yahoo to dovanluon



Nghiên cứu phát triển các kỹ thuật xây dựng và khai thác thông tin web có ngữ nghĩa : Báo cáo tổng kết khoa học và kỹ thuật của đề tài

Sau gần hai thập niên ra đời và phát triển từ năm 1989, World Wide Web (WWW) đã trở thành một môi trường lưu trữ và chuyển tải thông tin không thể thiếu trong một thời đại mà máy tính là công nghệ đòn bẩy cho hầu hết mọi lĩnh vực của kinh tế, chính trị, và xã hội. Với sự phát triển vũ bão và bùng nổ thông tin trên nó, giờ cũng là lúc WWW cần chuyển sang một thế hệ mới để có thể được khai thác một cách hiệu quả phục vụ cho lợi ích của loài người. Đó là thế hệ Web có Ngữ nghĩa (Semantic Web), được Tim Berners-Lee, cha đẻ của WWW, phác thảo ra vào năm 1998. Ở thế hệ hiện tại, thông tin được lưu trữ trong các trang Web dưới dạng văn bản, hình ảnh, và âm thanh mà chỉ có con người mới đọc, nhìn, nghe và hiểu được. Với lượng thông tin vô cùng lớn trên WWW như hiện nay, con người không thể tự mình tìm kiếm, xử lý, và khai thác chúng, mà cần có sự trợ giúp của máy tính. Muốn vậy, trước hết máy tính phải hiểu được thông tin lưu trữ trong các trang Web để có thể xử lý chúng một cách tự động, tức là các trang Web phải có ngữ nghĩa đối với máy tính. Mục tiêu và viễn cảnh này của Web có ngữ nghĩa đã thu hút sự quan tâm và đầu tư của nhiều nhà nghiên cứu và các tổ chức trên thế giới Ngoài những vấn đề về lý thuyết và công nghệ chung, việc đưa ngữ nghĩa vào các trang Web còn phụ thuộc vào ngôn ngữ tự nhiên và miền tri thức cụ thể của từng quốc gia. Đó cũng là ý nghĩa của đề tài này, nhằm nghiên cứu phát triển các kỹ thuật xây dựng và khai thác thông tin Web có ngữ nghĩa tiếng Việt. Như là bước khởi đầu, đề tài tập trung vào mức độ ngữ nghĩa cơ bản nhất của một trang Web là lớp của các thực thể có tên, như con người, tổ chức, nơi chốn, xuất hiện trong đó. Trên cơ sở ngữ nghĩa này, đề tài phát triển một ứng dụng cung cấp tự động thông tin về các thực thể cho những người đọc tin trên Web. Trước hết, đề tài xây dựng một cơ sở tri thức về các thực thể phổ biến nhất ở Việt Nam và trên thế giới. Bước tiếp theo, đề tài nghiên cứu và hiện thực các kỹ thuật để xử lý tiếng Việt và rút trích lớp thực thể trên các trang Web một cách tự động. Đồng thời, đề tài nghiên cứu các độ đo và kỹ thuật xử lý truy vấn để người sử dụng có thể truy hồi chính xác hoặc gần đúng thông tin từ cơ sở tri thức đã xây dựng và kho tài liệu Web đã được chú thích. Trên các cơ sở này, đề tài phát triển các phần mềm ứng dụng rút trích và truy hồi thông tin cho người sử dụng đầu cuối, và xây dựng một hệ thống máy chủ để đáp ứng nhiều yêu cầu đồng thời. Các kết quả đạt được tạo nên một nền tảng cho Web có ngữ nghĩa tiếng Việt, đủ để hiện thực một số ứng dụng tiêu biểu và có thể phát triển tiếp thành một cơ sở hạ tầng hoàn chỉnh.

Trả Lời Với Trích Dẫn
TaiLieuTongHop.Com là một cộng đồng mở chia sẻ tài liệu miễn phí hoạt động phi thương mại. Chúng tôi không chịu trách nhiệm với nội dung bài viết của thành viên. van mau - dankinhte - soan bai, mod skin lol,mod skin -
Xin thông báo, bây giờ là 04:12 PM
|