Email:



Poll: VNB new Look?
Bạn có thích giao diện mới của VietnamBIZ không?
Trang chủ | Tin mới | Tin công nghệ | Google: Unicode "vượt mặt" ASCII
Google: Unicode "vượt mặt" ASCII
image

Sau nhiều năm "thống trị" World Wide Web, bảng mã ASCII đã phải nhường lại danh hiệu cho Unicode.

Unicode đã vượt qua ASCII để trở thành bộ mã ký tự phổ biến nhất trên thế giới World Wide Web - Mark Davis, kiến trúc sư phần mềm quốc tế cấp cao của Google, cho biết.

Unicode là chuẩn mã hoá kỹ tự được dùng cho rất nhiều ngôn ngữ khác nhau, ngay cả những ký tự La mã có dấu. Trong khi đó, ASCII là chuẩn đã tồn tại từ hàng thập kỷ nay, và bị giới hạn trong 128 hoặc 256 ký tự.

Google là một fan của các trang web sử dụng bộ mã Unicode. Khi xử lý dữ liệu thu thập được từ các website, đầu tiên gã khổng lồ tìm kiếm này sẽ chuyển chúng sang mã Unicode. Điều này cải thiện khả năng tìm kiếm của Google trên toàn cầu.

Unicode_shift_google
Đồ thị phát triển của Unicode trên Web

"Sự phổ biến của Unicode sẽ giúp đơn giản hoá việc xử lý các ngôn ngữ khác nhau mà chúng tôi đang sử dụng" - Mark Davis cho biết.

Hiện tại, Google đã chuyển sang sử dụng bộ mã Unicode phiên bản 5.1 vừa được phát hành hồi tháng 3.

"Điều này cho phép những người nói tiếng Malayalam có thể tìm kiếm bằng những từ khoá có chứa các ký tự mới" - Mark Davis giải thích.

Tuy nhiên, Unicode vẫn có nhược điểm so với ASCII. Bộ mã Unicode sẽ phải mất gấp đôi bộ nhớ để lưu trữ các ký tự alphebet La Mã do Unicode sử dụng nhiều byte dữ liệu hơn so với ASCII.

- Bảng mã chuẩn ASCII (American Standard Code for Information Interchange - Mã chuẩn Hoa kỳ trong Trao đổi Thông tin) bao gồm 128 kí tự, phần lớn là các kí số, kí tự tiếng Anh, những ký tự đặc biệt và thông dụng như các dấu cộng, trừ, phần trăm... ASCII là bộ mã đầu tiên được sử dụng ngay từ lúc máy tính được phát minh.

Khuyết điểm của ASCII là nó chỉ có 128 kí tự được cho phép. Mọi người cần nhiều mã hơn, nhất là sau khi hệ DOS và máy tính cá nhân xuất hiện. Vì vậy, người ta phải nghĩ ra bộ mã ANSI - hay còn gọi là bộ mã ASCII mở rộng.

- Bảng mã Unicode 16-bit: Cho phép lưu trữ 65536 mã (2 mũ 16). 256 kí tự đầu tiên của Unicode giống như của ASCII. Nói cách khác, ANSI (cũng như ASCII) là tập con của Unicode.

Ưu điểm của Unicode là nó có đủ chỗ để chứa toàn bộ các kí tự của các dân tộc trên thế giới.

VietnamBIZ (Theo 24h.com.vn)

Keywords: google, unicode, ASCII, World Wide Web, ký tự La mã, ,

Comments (đã post):

Viết comment của bạn comment

Please enter the code you see in the image:

  • email Gửi đi
  • print Print version
  • Plain text Xem dạng text
Tagsbox/article_tags
No tags for this article
Rate this article
0