Nhạc 24H Game Việc làm Chứng khoán SMS
Trang chủ 24giờ
Vi tính-Internet

Máy tính xách tay

Máy tính để bàn

QC trực tuyến

Phần mềm ngoại

Máy in/phụ kiện

Tin học văn pḥng

Game

Thủ thuật - Tiện ích

Sản phẩm mới

Sợ Virus ???

Tổng hợp 24H
Xem điểm thi
Bóng đá
Thời trang
Cấm Đàn ông!
Chứng khoán 24H
Phim
Bạn trẻ-Việc làm
Làm đẹp
Ca nhạc - MTV
Thể thao
Phi thường - kỳ quặc
Điện thoại
Sản phẩm - Công nghệ
Giáo dục - du học
Ô tô - Xe máy
Thị trường - Tiêu dùng
Ăn ǵ - du lịch ở đâu
Y tế - thiết bị
Chơi game 24h
Cười suốt 24giờ
T́m việc làm Tuyển người
Rao vặt
Danh bạ Website
24H RSS
tin tiêu điểm
Samsung - Microsoft: Bắt tay v́
Trào lưu PC mini h́nh thành với
Microsoft hoàn tất SQL Server 2008
Carl Icahn có "chân"
Lenovo ThinkPad X200: Sức mạnh
Yahoo! "mở" giao diện
Yahoo! cũng tham gia vào chiến
HP giới thiệu notebook siêu nhẹ
Intel tiết lộ về chip đồ họa độc
Google Street View đến Australia
 
   
Vi tính-Internet

Thứ Ba, ngày 06/05/2008, 18:50

 
Google: Unicode "vượt mặt" ASCII

Sau nhiều năm "thống trị" World Wide Web, bảng mă ASCII đă phải nhường lại danh hiệu cho Unicode.

Unicode đă vượt qua ASCII để trở thành bộ mă kư tự phổ biến nhất trên thế giới World Wide Web - Mark Davis, kiến trúc sư phần mềm quốc tế cấp cao của Google, cho biết.

Unicode là chuẩn mă hoá kỹ tự được dùng cho rất nhiều ngôn ngữ khác nhau, ngay cả những kư tự La mă có dấu. Trong khi đó, ASCII là chuẩn đă tồn tại từ hàng thập kỷ nay, và bị giới hạn trong 128 hoặc 256 kư tự.

Google là một fan của các trang web sử dụng bộ mă Unicode. Khi xử lư dữ liệu thu thập được từ các website, đầu tiên gă khổng lồ t́m kiếm này sẽ chuyển chúng sang mă Unicode. Điều này cải thiện khả năng t́m kiếm của Google trên toàn cầu.

Đồ thị phát triển của Unicode trên Web

"Sự phổ biến của Unicode sẽ giúp đơn giản hoá việc xử lư các ngôn ngữ khác nhau mà chúng tôi đang sử dụng" - Mark Davis cho biết.

Hiện tại, Google đă chuyển sang sử dụng bộ mă Unicode phiên bản 5.1 vừa được phát hành hồi tháng 3.

"Điều này cho phép những người nói tiếng Malayalam có thể t́m kiếm bằng những từ khoá có chứa các kư tự mới" - Mark Davis giải thích.

Tuy nhiên, Unicode vẫn có nhược điểm so với ASCII. Bộ mă Unicode sẽ phải mất gấp đôi bộ nhớ để lưu trữ các kư tự alphebet La Mă do Unicode sử dụng nhiều byte dữ liệu hơn so với ASCII.

- Bảng mă chuẩn ASCII (American Standard Code for Information Interchange - Mă chuẩn Hoa kỳ trong Trao đổi Thông tin) bao gồm 128 kí tự, phần lớn là các kí số, kí tự tiếng Anh, những kư tự đặc biệt và thông dụng như các dấu cộng, trừ, phần trăm... ASCII là bộ mă đầu tiên được sử dụng ngay từ lúc máy tính được phát minh.

Khuyết điểm của ASCII là nó chỉ có 128 kí tự được cho phép. Mọi người cần nhiều mă hơn, nhất là sau khi hệ DOS và máy tính cá nhân xuất hiện. V́ vậy, người ta phải nghĩ ra bộ mă ANSI - hay c̣n gọi là bộ mă ASCII mở rộng.

- Bảng mă Unicode 16-bit: Cho phép lưu trữ 65536 mă (2 mũ 16). 256 kí tự đầu tiên của Unicode giống như của ASCII. Nói cách khác, ANSI (cũng như ASCII) là tập con của Unicode.

Ưu điểm của Unicode là nó có đủ chỗ để chứa toàn bộ các kí tự của các dân tộc trên thế giới.

Bảo Nhi (24H.COM.VN)
Email cho ban beGửi email cho bạn bè   Y kien phan hoiÝ kiến phản hồi  Bam vao day de in Bản in
   
Các tin khác của mục Vi tính-Internet
   
Tổng hợp 24H
Nên Xem
Sự kiện tiêu điểm
  Giới thiệu Liên hệ QC Góp ý Đầu trang
 
© Copyright 2004-2007 24H.COM.VN, all rights reserved. Sử dụng phần mềm (L&C) OCM 5.0
Cơ quan chủ quản: Công ty Cổ phần Quảng cáo Trực tuyến 24H
Trụ sở: Tầng 16 - TT giao dịch CNTT Hà Nội, K1 Hào Nam, Giảng Võ, Cát Linh, Đống Đa, Hà Nội
Tel: (84-4) 512 1806 - Fax: (84-4) 512 1804
VPĐD: 14 Trường Sơn, P2, Q.Tân Bình, TP.Hồ Chí Minh. Tel: (84-8) 848 9845 - Fax: (84-8) 848 6519
Giấy phép số: 32/GP-BC - cấp ngày 28/03/2004 Bộ Văn hóa thông tin - Cục Báo chí
Chịu trách nhiệm xuất bản: Phan Minh Tâm
® Ghi rõ nguồn "24H.COM.VN" khi bạn phát hành lại thông tin từ website này.