Cách hiển thị ký tự đặc biệt với chuỗi thoát Escape Sequences

Khi bạn lập trình trong Assembly thì bạn sẽ phải sử dụng các chữ cái, số và các kỹ hiệu để viết mã hoàn chỉnh. Tuy nhiên thì bất kỳ chương trình nào cũng phải có sự tương tác giữa người dùng và chuỗi công cụ. Trong đó hầu hết các ngôn ngữ lập trình đều sẽ đi kèm với một tập hợp các chuỗi thoát hay còn gọi là Escape Sequences mà các bạn có thể sử dụng để triển khai các ký tự và cụm từ đặc biệt của mỗi chuỗi. Cùng Box.edu tìm hiểu thêm về chuỗi thoát này nhé!

👉 Xem thêm: Hướng dẫn nhúng C cho những người mới bắt đầu

👉 Xem thêm: Hướng dẫn cách làm việc với Cú pháp C hiệu quả nhất

👉 Xem thêm: Hướng dẫn cách sử dụng bộ nhớ tệp C FILE I/O

Mục lục bài viết

Tổng quan về Escape Sequences

tong-quan-ve-escape-sequences.jpg

Tổng quan về Escape Sequences

Trong ngôn ngữ lập trình C, có tổng cộng 256 số ký tự trong bộ ký tự. Toàn bộ bộ ký tự này sẽ được chia thành 2 phần đó là: bộ ký tự ASCII và bộ ký tự ASCII mở rộng. Ngoài ra có một số ký tự khác cũng ở đó mà không phải là một phần của bất kỳ bộ ký tự nào, và chúng được gọi với cái tên là ký tự ESCAPE.

Escape Sequences hay trình tự thoát được hiểu là một loạt các ký tự thay đổi trạng thái của máy tính và các thiết bị kèm theo của chúng. Ngoài ra còn được gọi là chuỗi điều khiển, những chuỗi ký tự này sẽ cho phép các bạn xử lý các tác vụ của máy tính.

Đa phần tất cả các chuỗi thoát đều bắt đầu bằng một ký tự thoát báo hiệu sự bắt đầu của một chuỗi. Trước đây, ký tự này chính là một ký tự dành riêng được gửi bởi phím Esc, tuy nhiên cho đến nay, hầu hết các ngôn ngữ lập trình đều sử dụng dấu gạch chéo ngược (\) để có thể thay thế một cách dễ dàng. Trên thực tế tất cả các chuỗi thoát đều cho phép truy cập và hiển thị các ký tự không in được cùng với các tính năng phần cứng đặc biệt khác thông qua các chương trình nhất định.

Tiêu chuẩn chung của trình tự thoát Escape Sequences

Mỗi ngôn ngữ lập trình sẽ có tập hợp các chuỗi thoát khác nhau, đặc biệt có nhiều ngôn ngữ sẽ có chung một bộ ký tự tiêu chuẩn cơ bản được phát triển cho ngôn ngữ lập trình C. Do đó bạn có thể tìm cho mình một trình tự phổ biến chỉ cần nhớ rằng những mã này có phân biệt chữ hoa và chữ thường. Cho nên nếu sử dụng sai trường hợp thì có thể gây ra nhiều lỗi trong quá trình chạy chương trình.

\ ‘ Trích dẫn duy nhất
\ ” Dấu ngoặc kép
\một Chuông âm thanh
\ b Backspace
\ f Thức ăn dạng
\N Dòng mới
\ r Vận chuyển trở lại
\S Khoảng trắng hoặc khoảng trắng.
\ t Tab ngang

Ngoài những trình tự phổ biến được kể ở trên thì sẽ còn bộ tiêu chuẩn gồm các trình tự cho toàn bộ ký tự Unicode. Do đó bạn có thể dễ dàng nhập bất kỳ ký tự nào, cả in được và không in được, chỉ bằng cách sử dụng các chuỗi Unicode thập lục phân của chúng để làm chuỗi thoát. Đồng thời để có thể sử dụng được định dạng này thì bạn cũng cần sử dụng thêm \ x làm ký tự thoát, tiếp đến là Unicode thích hợp. Ví dụ như: chuỗi thoát \ x56 là chữ V.

#include <iostream>;
int main ()
{
std :: printf ("This \ nis \ na \ ntest \ n \ nCô ấy nói, \" Bạn có khỏe không? \ "\ n");
}

Ví dụ này sẽ được xuất ra dưới dạng:

Cái này
Là
một
kiểm tra
Cô ấy nói, "Bạn có khỏe không?"

Dựa vào đây bạn sẽ thực hiện việc triển khai mã thoát, có thể coi chúng như là các ký tự bình thường trong chuỗi của bạn. Như bạn thấy, bạn triển khai mã thoát như thể chúng là các ký tự bình thường trong chuỗi của bạn. 

Tìm hiểu về chuỗi thoát Escape Sequences HTML

tim-hieu-ve-chuoi-thoat-escape-sequences-html.jpg

Tìm hiểu về chuỗi thoát Escape Sequences HTML

Hầu hết các ngôn ngữ sử dụng cho các mã thoát được trình bày ở trên thì sẽ có một vài trường hợp ngoại lệ như là HTML.

HTML sẽ sử dụng hai bộ trình tự thoát khác nhau. Đầu tiên, được gọi là các thực thể ký tự HTML, chúng được sử dụng trực tiếp trong mã HTML để đại diện cho các ký tự đặc biệt. Tập hợp còn lại được trình duyệt web sử dụng để cho phép các ký tự đặc biệt và không phải tiếng Anh trong địa chỉ web.

Có thể nói hiện nay các mã ký tự HTML trở nên phổ biến hơn nhiều. Trong đó các chuỗi thoát sử dụng dấu và & làm ký tự thoát, đồng thời kết thúc bằng dấu chấm phẩy. Đặc biệt khả năng bạn sẽ phải sử dụng & nbsp nhiều nhất – mang nghĩa là không gian không phá vỡ và tạo ra một không gian mà các trình duyệt Web sẽ không thể bỏ qua được. 

Trưng bày Tên Thực thể HTML Unicode
Không gian không phá vỡ & nbsp;
< Ít hơn & lt; <
> Nhiều hơn & gt; >
& Ký hiệu và & amp; &
Dấu ngoặc kép & quot;
© Bản quyền & sao chép; ©
® Thương hiệu đã được đăng ký & reg; ®
Thương hiệu (Hoa Kỳ) &buôn bán;
× Dấu nhân & lần; ×
÷ Dấu hiệu phân chia &chia; ÷

Ở bảng trên bạn có thể sử dụng Unicode tại đây bằng cách sử dụng chuỗi & # làm lý tự thoát. Ngoài ra bạn có thể tìm thấy danh sách đầy đủ các thực thể ký tự HTML bằng những bước tìm kiếm đơn giản trên Internet.

Các thực thể ký tự HTML hoạt động cũng giống như trình tự thoát C. Chỉ cần bạn chèn chúng vào chuỗi, thuộc tính và văn bản của mình. Các trình duyệt web cũng lấy nó từ đó. Đặc biệt nên nhớ rằng chuỗi thoát HTML phải được kết thúc bằng dấu chấm phẩy nếu không các trang web của bạn có thể không hiển thị như bạn mong đợi. Cũng cần lưu ý rằng mã HTML cũng phân biệt chữ hoa chữ thường như các mã C của chúng. Đối với các thực thể ký tự URL, chúng chỉ là chuỗi Unicode đứng trước biểu tượng phần trăm (%).

Những bộ trình tự chuỗi thoát Escape Sequences không tiêu chuẩn khác

Tuy rằng bạn có nhiều khả năng sẽ gặp phải 2 tập hợp trình tự ở trên. Nhưng có một vài tệp không chuẩn có sẵn với các ký tự thoát, định dạng trình tự của riêng chúng. Do đó, bạn chỉ cần gõ đúp các ký tự mà bạn cần. Thông thường nó được sử dụng bởi các ngôn ngữ lập trình cơ bản như: Visual BASIC. Bạn có thể viết các chuỗi này bằng cách gõ mỗi ký tự thoát hai lần. Vì bạn chỉ có thể gõ kép các ký tự in được, các ngôn ngữ lập trình này thường đi kèm. Với các hằng số chuỗi đặc biệt cho các ký tự không thể in được như tab và dòng mới.

Chính xác thì trình tự thoát tồn tại để giúp các bạn có thể nhúng các ký tự không in được hoặc các điều khiển phần cứng vào chương trình của bạn. Mặc dù mọi ngôn ngữ lập trình đều có các quy tắc thoát riêng. Nhưng hầu hết các chuỗi đều bắt đầu bằng một ký tự thoát đặc biệt. Theo sau là nhiều mã ký tự thực. Hiện nay một vài ngôn ngữ như HTML cũng yêu cầu các ký tự kết thúc. Mặc dù bạn có thể không bao giờ phải sử dụng chúng. Nhưng trình tự thoát Escape Sequences sẽ cho phép chương trình của bạn hiển thị các dấu câu và định dạng kết quả đầu ra của chúng.

Qua những phân tích ở trên chúng tôi đã tổng hợp. Và thông tin lại những vấn đề quan trọng về đặc điểm. Cấu tạo cũng như ý nghĩa của các chuỗi thoát Escape Sequences trong lập trình C. Ngoài ra, cũng đã thảo luận chi tiết về các loại trình tự thoát khác nhau. Và một chương trình minh họa giúp các bạn có thể nắm bắt được cách sử dụng. Của những trình thoát này một cách dễ dàng và hiệu quả nhất.

Tổng kết

Chuỗi thoát hay trình tự thoát Escape Sequences được Box.edu trình bày ở trên. Mong rằng sẽ giúp cho các bạn tự tin và nắm bắt kiến thức một cách chính xác nhất. Việc hiểu biết thêm về những mảng, thành phần của chương trình ngôn ngữ lập trình. Sẽ giúp bạn nâng cao bản thân để có thể tìm hiểu các ngôn ngữ lập trình khác. Cuối cùng là gửi lời chúc thành công đến với các bạn. Đang muốn tìm hiểu về lĩnh vực ngôn ngữ lập trình C này.

5/5 - (20 bình chọn)
Xin chào các bạn! Mình là Hà Nguyên Phương Hiện đang là tác giả của Box.edu.vn website nổi tiếng chuyên review, đánh giá, giới thiệu các khóa học hay nhất hiện nay.