Trang chủ 24h TRA CỨU ĐIỂM THI 2009
Diễn đàn Eva Nhac.vui.vn
Thế giới Eva Tuyển dụng Việc làm
Danh bạ web Cười 24H
Kho Mobile Game Kho nhạc chuông
     
 
Nhac.vui.vn  Tuyển dụng  Tìm việc  KQXS  Chứng khoán  Game
Vi tính-Internet
Thứ Ba, ngày 06/05/2008, 18:50 Gửi bài viết này cho bạn bè
Google: Unicode "vượt mặt" ASCII

Google: Unicode "vượt mặt" ASCII

Sau nhiều năm "thống trị" World Wide Web, bảng mã ASCII đã phải nhường lại danh hiệu cho Unicode.

Unicode đã vượt qua ASCII để trở thành bộ mã ký tự phổ biến nhất trên thế giới World Wide Web - Mark Davis, kiến trúc sư phần mềm quốc tế cấp cao của Google, cho biết.

Unicode là chuẩn mã hoá kỹ tự được dùng cho rất nhiều ngôn ngữ khác nhau, ngay cả những ký tự La mã có dấu. Trong khi đó, ASCII là chuẩn đã tồn tại từ hàng thập kỷ nay, và bị giới hạn trong 128 hoặc 256 ký tự.

Google là một fan của các trang web sử dụng bộ mã Unicode. Khi xử lý dữ liệu thu thập được từ các website, đầu tiên gã khổng lồ tìm kiếm này sẽ chuyển chúng sang mã Unicode. Điều này cải thiện khả năng tìm kiếm của Google trên toàn cầu.

Google: Unicode "vượt mặt" ASCII, Vi tính-Internet,

Đồ thị phát triển của Unicode trên Web

"Sự phổ biến của Unicode sẽ giúp đơn giản hoá việc xử lý các ngôn ngữ khác nhau mà chúng tôi đang sử dụng" - Mark Davis cho biết.

Hiện tại, Google đã chuyển sang sử dụng bộ mã Unicode phiên bản 5.1 vừa được phát hành hồi tháng 3.

"Điều này cho phép những người nói tiếng Malayalam có thể tìm kiếm bằng những từ khoá có chứa các ký tự mới" - Mark Davis giải thích.

Tuy nhiên, Unicode vẫn có nhược điểm so với ASCII. Bộ mã Unicode sẽ phải mất gấp đôi bộ nhớ để lưu trữ các ký tự alphebet La Mã do Unicode sử dụng nhiều byte dữ liệu hơn so với ASCII.

- Bảng mã chuẩn ASCII (American Standard Code for Information Interchange - Mã chuẩn Hoa kỳ trong Trao đổi Thông tin) bao gồm 128 kí tự, phần lớn là các kí số, kí tự tiếng Anh, những ký tự đặc biệt và thông dụng như các dấu cộng, trừ, phần trăm... ASCII là bộ mã đầu tiên được sử dụng ngay từ lúc máy tính được phát minh.

Khuyết điểm của ASCII là nó chỉ có 128 kí tự được cho phép. Mọi người cần nhiều mã hơn, nhất là sau khi hệ DOS và máy tính cá nhân xuất hiện. Vì vậy, người ta phải nghĩ ra bộ mã ANSI - hay còn gọi là bộ mã ASCII mở rộng.

- Bảng mã Unicode 16-bit: Cho phép lưu trữ 65536 mã (2 mũ 16). 256 kí tự đầu tiên của Unicode giống như của ASCII. Nói cách khác, ANSI (cũng như ASCII) là tập con của Unicode.

Ưu điểm của Unicode là nó có đủ chỗ để chứa toàn bộ các kí tự của các dân tộc trên thế giới.

Bảo Nhi (24H.COM.VN)
Gửi bài viết này cho bạn bè     Ý kiến phản hồi     Bản in
Tin cùng mục Vi tính-Internet
Tin mục Tổng hợp 24H
 
Tin nổi bật mục Vi tính-Internet
Tổng hợp 24h
  Giới thiệu      |      Liên hệ QC      |      Góp ý      |      Đầu trang  
© Copyright 2004-2007 24H.COM.VN, all rights reserved. Sử dụng phần mềm (L&C) OCM 5.9
Cơ quan chủ quản: Công ty Cổ phần Quảng cáo Trực tuyến 24H
Trụ sở: Tầng 16 - TT giao dịch CNTT Hà Nội, K1 Hào Nam, Giảng Võ, Cát Linh, Đống Đa, Hà Nội
Tel: (84-4) 3512 1806 - Fax: (84-4) 3512 1804
VPĐD: Tầng 5 – Toà nhà Hải Âu - 39B Trường Sơn, P2, Q.Tân Bình, TP.Hồ Chí Minh
Tel: (84-8) 3848 9845 - Fax: (84-8) 3848 6519
Giấy phép số: 32/GP-BC - cấp ngày 28/03/2004 Bộ Văn hóa thông tin - Cục Báo chí
Chịu trách nhiệm xuất bản: Phan Minh Tâm
® Ghi rõ nguồn "24H.COM.VN" khi bạn phát hành lại thông tin từ website này.
X
CNT2T3T4T5T6T7