Unicode đă vượt qua ASCII để trở thành bộ mă kư tự phổ biến nhất trên thế giới World Wide Web - Mark Davis, kiến trúc sư phần mềm quốc tế cấp cao của Google, cho biết. Unicode là chuẩn mă hoá kỹ tự được dùng cho rất nhiều ngôn ngữ khác nhau, ngay cả những kư tự La mă có dấu. Trong khi đó, ASCII là chuẩn đă tồn tại từ hàng thập kỷ nay, và bị giới hạn trong 128 hoặc 256 kư tự. Google là một fan của các trang web sử dụng bộ mă Unicode. Khi xử lư dữ liệu thu thập được từ các website, đầu tiên gă khổng lồ t́m kiếm này sẽ chuyển chúng sang mă Unicode. Điều này cải thiện khả năng t́m kiếm của Google trên toàn cầu. 
Đồ thị phát triển của Unicode trên Web "Sự phổ biến của Unicode sẽ giúp đơn giản hoá việc xử lư các ngôn ngữ khác nhau mà chúng tôi đang sử dụng" - Mark Davis cho biết. Hiện tại, Google đă chuyển sang sử dụng bộ mă Unicode phiên bản 5.1 vừa được phát hành hồi tháng 3. "Điều này cho phép những người nói tiếng Malayalam có thể t́m kiếm bằng những từ khoá có chứa các kư tự mới" - Mark Davis giải thích. Tuy nhiên, Unicode vẫn có nhược điểm so với ASCII. Bộ mă Unicode sẽ phải mất gấp đôi bộ nhớ để lưu trữ các kư tự alphebet La Mă do Unicode sử dụng nhiều byte dữ liệu hơn so với ASCII. - Bảng mă chuẩn ASCII (American Standard Code for Information Interchange - Mă chuẩn Hoa kỳ trong Trao đổi Thông tin) bao gồm 128 kí tự, phần lớn là các kí số, kí tự tiếng Anh, những kư tự đặc biệt và thông dụng như các dấu cộng, trừ, phần trăm... ASCII là bộ mă đầu tiên được sử dụng ngay từ lúc máy tính được phát minh. Khuyết điểm của ASCII là nó chỉ có 128 kí tự được cho phép. Mọi người cần nhiều mă hơn, nhất là sau khi hệ DOS và máy tính cá nhân xuất hiện. V́ vậy, người ta phải nghĩ ra bộ mă ANSI - hay c̣n gọi là bộ mă ASCII mở rộng. - Bảng mă Unicode 16-bit: Cho phép lưu trữ 65536 mă (2 mũ 16). 256 kí tự đầu tiên của Unicode giống như của ASCII. Nói cách khác, ANSI (cũng như ASCII) là tập con của Unicode. Ưu điểm của Unicode là nó có đủ chỗ để chứa toàn bộ các kí tự của các dân tộc trên thế giới. |
|