Giao thức ITU-T G8032 ERPS

Chuyển mạch Bảo vệ Vòng Ethernet (Ethernet Ring Protection Switching  - ERPS) là giao thức được đưa ra của Liên minh Viễn thông Quốc tế ITU-T dành cho kết nối chuyển mạch với vòng dự phòng tại lớp 2, tiêu chuẩn  ITU-T G.8032. Liên kết Bảo vệ Vòng dùng cho kết nối dự phòng và nâng cao độ tin cậy của mạng. Tuy nhiên việc sử dụng liên kết bảo vệ vòng sẽ gây ra hiện tượng phát đồng loạt các gói tin và làm bảng MAC không ổn định. Việc này tác động đến hệ thống mạng, chất lượng kết nối và liên kết bị gián đoạn.

Giao thức  Spanning Tree Protocol (STP), Rapid Spanning Tree Protocol (RSTP), và Multiple Spanning Tree Protocol (MSTP) thường dùng chặn việc lặp lại gói tin. STP đáp ứng yêu cầu độ tin cậy mạng nhưng chậm hội tụ. RSTP và MSTP có cải tiến hơn nhưng vẫn cấp độ thấp hơn. So với STP, RSTP và MSTP, ERPS có ưu điểm sau:

Hội tụ mạng nhanh hơn

ERPS kế thừa các công nghệ vòng truyền thống như STP/RSTP/MSTP  và thêm khả năng hội tụ mạng nhanh. Các switch có ERPS hội tụ chỉ mất 50-ms cho gói tin phát broadcast.

Tương thích tốt

ERPS dùng vòng dự phòng lớp 2 theo chuẩn ITU nên tương thích được nhiều thiết bị chuyển mạch do các hãng khác nhau sản xuất.  

Một số tính năng của ERPS:

Ring Protection Link (RPL): liên kết thiết kế dùng cơ chế Chặn khi thiết bị ở trạng thái nghỉ (idle) để tránh phát lặp trên vòng cầu nối (Bridged ring).

RPL Owner node: node kết nối với RPL chặn lưu lượng trên RPL  khi ở trạng thái nghỉ idle và mở khi ở trạng thái chạy dự phòng (Protection state).

RPL Neighbor node: node kết nối với RPL chặn lưu lượng trên RPL  khi ở trạng thái nghỉ idle và mở khi ở trạng thái chạy dự phòng (Protection state) - phiên bản v2.

Link Monitoring: liên kết trên vòng được theo dõi bằng tiêu chuẩn  ETH CC OAM messages (CFM).

Signal Fail (SF - tín hiệu lỗi) : Signal Fail được khai báo khi trạng thái tín hiệu hỏng được phát hiện.

No Request (NR) : NR được khai báo khi không có tình trạng nào trên node.

Ring APS (R-APS) Messages: thông báo giao thức theo Y.1731 và G.8032.

Automatic  Protection  Switching  (APS)  Channel: VLAN vòng diện rộng chuyên dụng truyền thông điệp OAM bao gồm cả R-APS.

G.8032 ERPS dùng sai lệch thời gian để tránh phát trùng lặp và các hoạt động chuyển mạch không cần thiết.

Delay Timers: RPL Owner  dùng xác định mạng đã ổn định trước khi chặn RPL.

- Sau trạng thái SF (tín hiệu bị lỗi) - thời gian chờ Wait-to-Restore (WTR) để xác định tín hiệu SF không liên tục.

- Sau lệnh Force Switch/Manual Switch, thời gian chờ Wait-to-Block (WTB) dùng xác định không có điều kiện nền. Thời gian WTB ngắn hơn WTR.

Guard Timer: dùng bởi tất cả các node khi thay đổi trạng thái, đồng thời cũng chặn tất cả các thông điệp quá hạn có thể gây chuyển trạng thái không cần thiết.

Hold-off Timers : dùng bởi lớp dướ ETH lọc ra các liên kết lỗi không liên tục.

- Lỗi chỉ được báo với mạch bảo vệ vòng khi hết hạn thời gian này.

Phương thức hoạt động của ERPS

Các thành phần ERPS

Hình dưới là chuyển mạch bảo vệ vòng ERPS gồm 4 nút. Mỗi nút kết nối với vòng qua 2 cổng, hay còn gọi là liên kết. Một liên kết là Liên kết Bảo vệ Vòng (Ring Protection Link - RPL). Một cổng RPL kết nối với thiết bị Chủ (Owner), cổng kia kết nối với thiết bị lân cận (Neighbor).

 

Hình 1. EPRS 4 nút

Bảo vệ Vòng Ethernet

Mỗi nút có một Bảo vệ Vòng Ethernet (Ethernet Ring Protection - ERP) gồm:

- 02 cổng vòng ERPS.

- 01 VLAN truyền thông điệp Chuyển mạch Bảo vệ Tự động Vòng (Ring-Automatic Protection Switching - R-APS).

- một hoặc nhiều VLAN Dữ liệu Dự phòng (Protected Data VLAN) dùng khi vòng bị gián đoạn.

Cổng vòng ERP

Là cổng vật lý hoặc cổng Link Aggregation Groups (LAGs). Với ví dụ trên mỗi nút đều có 2 cổng ERP, kết nối theo hai hướng Đông và Tây của vòng. 

Kênh VLAN R-APS (VLAN điều khiển)

Trong G.8032 gói tin R-APS được truyền trong một kênh VLAN riêng(VLAN rap). Mỗi tiến trình bảo vệ vòng ERP sử dụng một VLAN gán nhãn để gửi và nhận  gói tin R-APS. Tất cả các nút trong vòng bắt buộc phải sử dụng VLAN gán nhãn, và VLAN này phải có cổng vòng ERP. Chức năng của VLAN R-APS theo dõi vòng và duy trì các chức năng hoạt động. R-APS VLAN không dùng để truyền dữ liệu. Thông điệp R-APS truyền xung quanh vòng để điều khiển việc bảo vệ thiết bị switch. 

Mỗi nút trên đường truyền sẽ nhận được gói tin  R-APS trên VLAN rap và sao chép lại để xử lý tại chỗ.  Thiết bị cũng sẽ truyền gói tin gốc theo lớp 2 chuyển mạch đến cổng ring tiếp theo. Nếu kênh VLAN rap trên cổng chuyển mạch bị chặn thì gói tin R-APS sẽ không chuyển được đến nút mạng tiếp theo.

VLAN điều khiển rap bị chặn chuyển tiếp đến nút khác khi VLAN bảo vệ bị chặn chuyển tiếp.

Nút tạo gói tin R-APS gốc sẽ gửi gói tin lên tất cả các cổng của nút bất kể VLAN rap có bị chặn trên cổng ring nó hay không. Tương tự như vậy gói tin R-APS được nhận và xử lý bất kể VLAN rap có bị chặn trên cổng ring hay không.

VLAN truyền dữ liệu (VLAN được bảo vệ - Protected Data VLAN)

Mỗi tiến trình ERP bảo vệ một hay nhiều VLAN truyền tải dữ liệu. Tất cả các nút trên vòng phải có cùng VLAN được bảo vệ.  VLAN được bảo vệ phải có cổng ring giống nhau.

RPL-Owner

RPL cho phép chặn truyền dẫn gói tin trong điều kiện hoạt động bình thường để tránh phát trùng lặp gói tin. RPL bao gồm Owner (Chủ) ở một đầu và Neighbor ở đầu còn lại. Owner điều khiển chính cho bảo vệ vòng. Ở điều kiện bình thường thì cả hai đầu RPL đều bị chặn. Tuy nhiên Owner phải tạo gói tin R-APS không yêu cầu (R-APS No Request - NR) và RPL bị chặn (RPL-Blocked - RB) liên tục để báo chặn RPL và thông báo trạng thái.

Trong điều kiện bình thường khi không có sự cố RPL-Owner tạo các gói tin R-APS (NR,RB). Nó định kỳ 5 giây gửi các gói tin này đến các cổng ring. Gói tin này báo hiệu cổng ring hướng  Đông và Tây bị chặn. Nút khi nhận được gói tin R-APS sẽ ghi lại Số thứ tự nút (Node-id ) và Cổng bị chặn ( Block Port Reference (BPR)) trong gói tin. Thông số này dùng để phát hiện thay đổi sơ đồ kết nối.

Lưu ý: Không nên bao giờ cấu hình ring G.8032 mà không có RPL-Owner. Khi giao thức G.8032 hoạt động không có RPL-Owner, các nút trên vòng đều được gửi gói tin R-APS và chặn truyền dẫn cả trong điều kiện bình thường và điều kiện sự cố, RPL-Owner cho phéo dự đoán nơi ring bị chặn trong điều kiện hoạt động bình thường. 

Vòng bị sự cố

Khi phát hiện sự cố trên cổng ring (Signal Fail - SF), nút có sự cố tạo gói tin R-APS (SF). Gói tin này báo cho các nút khác về sự cố trên vòng, và yêu cầu bảo vệ chuyển mạch switch. Nút RPL bỏ chặn liên kết RPL, và tất cả các nút thực hiện Forwarding Database (FDB) để khôi phục nhanh chóng lưu lượng truyền dẫn. 

Khi Signal Fail (SF) được phát hiện, nút phát hiện lỗi sẽ chặn tất cả các cổng kết nối VLAN được bảo vệ, thực hiện FDB flush cho VLAN được bảo vệ, gửi gói tin R- APS với yêu cầu chuyển hướng switch do tín hiệu lỗi. Thiết bị gửi gói tin R-APS(SF) cho tất cả cổng ring của nó. R-APS đầu tiên gửi loại 3 gói tin R-APS, sau đó tiếp tục gửi lặp lại gói tin sau mỗi 5 giây cho đến Signal Fail (SF) mất đi. Cũng như RPL-Owner, thiết bị gửi gói tin R-APS với số hiệu nút  node-id của nó và BPR đế báo cổng ring nào bị chặn.

Khi gói tin R-APS mới được tạo được nút khác nhận, mỗi nút sẽ ghi nhận node id và BPR có khác với gói tin đã nhận, thì tiến hành cập nhập  FDB flush. Gói tin R-APS được nhận cuối cùng bởi RPL- Owner và RPL-Neighbor. R-APS(SF) cũng chỉ ra có chỗ bị chặn trên vòng, cho phép RPL-Owner và RPL-Neighbor bỏ chặn mà không gây lặp gói tin. RPL-Owner cũng lưu ý node id và BPR trong gói tin R-APS nhận được nếu không phải của nó và RPL của nó thì sẽ thực hiện cập nhập FDB flush. Đến lúc này, vòng đã kết thúc quá trình chuyển switch bảo vệ.

Tiến trình hoàn nguyên (Revertive) và không hoàn nguyên (non-revertive)

G.8032 cho phép tiến trình hoàn nguyên. Khi hết gián đoạn mạch và sau khoảng thời gian chờ thôngt thường là 5 phút, mạch vòng chuyển về chế độ hoạt động bình thường (hoàn nguyên). G.8032 cũng cho phép tiến trình không hoàn nguyên (non-revertive), khi sự cố kết thúc, chuyển mạch được bảo vệ không quay lại trạng thái bình thường nữa. Trong trường hợp này liên kết bị lỗi vẫn bị chặn và RPL không được bỏ chặn. Một lệnh cho phép cấu hình chọn chế độ hoàn nguyên hoặc không hoàn nguyên.     

Lưu ý: Khi chọn chế độ hoàn nguyên, mạch vòng sẽ không hoàn nguyên ngay lập tức.  Quá trình chuyển ngược chỉ bắt đầu khi bộ đếm giờ Wait-To-Restore hết hạn, thường trong khoảng 5 phút.  

Chuyển mạch cưỡng bức (Forced switch - FS),  Chuyển mạch bằng tay (manual switch - MS) và tiến trình xoá

Chuyển mạch cưỡng bức (Forced Switch -FS) là lệnh cưỡng bức vòng chuyển mạch. Lệnh đưa ra tại nút xác định và giao diện xác định trên vòng. Lệnh làm chặn trên giao diện (và bỏ chặn trên giao diện đối diện) và gói tin R- APS Forced Switch (FS) được truyền vòng quanh vòng. Kết quả RPL được bỏ chặn. Bất kỳ nút nào đang bị chặn trước đó cũng sẽ được bỏ chặn khi nhận được gói tin này. FDB flushes cũng được thực hiện trong quá trình này.

Để undo lệnh này dùng lệnh xoá (Clear) tại cùng nút. Nó sẽ xoá trạng thái chặn block trước đó được áp dụng. Lệnh cũng gửi đi gói tin R-APS No Request (NR), làm RPL bị chặn trở lại.

Lưu ý: lệnh Forced Switch (FS) có thể thực hiện được tại nhiều vùng trên vòng. Tuy nhiên nếu như thế vòng sẽ bị phân đoạn.

Lệnh Manual Switch (MS) có tác dụng giống như lệnh Forced Switch (FS) chỉ trừ chỉ có một lệnh Manual Switch (MS) có thể thực hiện trên vòng. Lệnh cũng có độ ưu tiên thấp hơn Forced Switch (FS) nếu như nút nhận được nhiều lệnh cùng lúc phải xử lý. 

Hỗ trợ vòng con (Sub-ring )

G.8032 Version 2 hỗ trợ kết nối mô hình vòng con subring. Vòng con có thể kết nối phần vòng không đóng kín có dạng hình chữ "C". Vòng con có thể kết nối với vòng chính kín hoàn toàn thông thường, hoặc kết nối qua các vòng con khác với vòng chính. Kết nối sẽ tạo thành mô hình vòng phức tạp như hình vẽ dưới đây:

 

Hình 2. Mô hình sub ring với các kiểu liên kết khác nhau.

Mô hình nhiều vòng ring cần một vòng chính (Major ring) liên kết với các vòng phụ. Có một số ngoại lệ như trong hình:

- Hai vòng chính liên kết qua một nút:

- Hai vòng chính kết nối qua vòng phụ đặc biệt được chia thành 2 nửa dùng kênh ảo:

Điểm khác biệt giữa vòng phụ và vòng chính là VLAN raps-channel control không bị chặn trên vòng phụ, thậm chí ngay cả khi VLAN bảo vệ bị chặn. Khi cấu hình các nút trên vòng phụ, người điều khiển cần kiểm tra lại nút đã được cấu hình hoạt động như vòng phụ chưa. Một ngoại lệ là vòng phụ cũng dùng kênh ảo, raps-channel VLAN bị chặn như cách của vòng chính.

Thông báo Thay đổi mô hình kết nối (Topology change notification - TCN) 

Khi vòng phụ được sử dụng kết nối với vòng chính hoặc các vòng phụ khác, sẽ có thay đổi vùng chặn trên vòng phụ, dẫn đến tuyến truyền dẫn mô hình kết nối "hoạt động" thay đổi của các VLAN trên toàn mạng thay đổi.  Việc này được minh hoạ theo hình vễ dưới đây:

 

Hình 3. Thay đổi mô hình kết nối đang hoạt động.

Đường truyền VLAN dữ liệu từ A sang B được bảo vệ ở vòng chính và vòng phụ qua đường gach chấm đỏ, qua nút 4-3-6-7. Khi có lỗi mạng tại vòng phụ như trên hình vẽ, mạng sẽ chặn xung quanh chỗ bị lỗi, trong khi đó RPL vòng phụ được mở ra cho lưu thông dữ liệu. Mô hình kết nối truyền dữ liệu VLAN đã được thay đổi. Đường truyền dẫn dữ liệu từ A sang B sẽ khác với đường chấm gạch đỏ cũ, mà đi qua nút 4-5-8-7. Tuy nhiên nút trên vòng chính 4 cũng như 1,2 không biết thay đổi mô hình kết nối trên vòng phụ nên vẫn truyền dữ liệu từ A sang B theo đường gạch chấm đỏ.

Để thay đổi, nút trên vòng chính cần làm mới bảng FDB (flush FDB). Với các nút kết nối với nhau, để thực hiện điều này tiến trình ERP vòng phụ cần thông báo cho tiến trình ERP vòng chính để nó thông báo cho tất cả các nút vòng chính. Mặc dù hai tiến trình này độc lập với nhau nhưng các nút kết nối với nhau có cách thức biết tiên trình nào cùng bảo vệ một VLAN. Tiến trình ERP vòng phụ có thể xác định được tiến trình ERP vòng chính cần thông báo khi thay đổi mô hình kết nối vòng phụ. 

Khi tiến trình ERP vòng chính nhận được thông báo TCN từ tiến trình ERP vòng phụ, tiến trình ERP vòng chính sẽ gửi gói tin R-APS với mã cập nhập bảng FDB (Flush Event). Gói tin sẽ chạy trên vòng chính khiến các tiến trình ERP khác vòng chính thực hiện làm mới bảng FDB (FDB flush). Sau đó bảng MAC được cập nhập và đường truyền dữ liệu theo đi theo mô hình đúng mới.

 Lưu ý không phải bất kỳ trường hợp nào cũng cần toàn bộ vòng chính cập nhập FDB dùng gói tin R-APS Flush Event. Ví dụ nếu nút 4 không ở trên vòng chính, thì chỉ cần cập nhập cổng vòng chính của nút 3 và 5. Trong trường hợp này tiến trình vòng phụ nút 3 sẽ thông báo nội bộ trong nút tiến trình vòng chính nút 3 để cập nhập. Tương tự như vậy tiến trình vòng phụ tại nút 5 sẽ thông báo tiến trình vòng chính nút 5 cập nhập. Như vậy G.8032 cho phép không gửi gói tin R-APS Flush Event lên vòng chính khi TCN xuất hiện trên vòng phụ.  

Phương thức hoạt động ERPS

Trạng thái bình thường

1. Tất cả các node kết nối vật lý tạo thành vòng.

2. ERPS chặn RPL để tránh lặp gói tin. Trong hình liên kết giữa Node1 và Node 4 là RPL.

3. ERPS theo dõi hư hỏng liên kết giữa các node liền kề.             

Trạng thái hỏng liên kết

1. Các node liền kề liên kết lỗi chặn liên kết lỗi và gửi gói tin R-APS(SF) thông báo cho các node khác trên vòng về liên kết lỗi. Trong hình, liên kết giữa node 2 và 3 bị lỗi.

2. Sau khoảng thời gian hold-off timer, Node 2 và 3 chặn liên kết lỗi và gửi gói tin R-APS(SF) cho các node khác trên vòng.

3. Gói tin R-APS(SF) kích hoạt node chủ RPL (RPL owner node) để bỏ chặn cổng RPL. Tất cả các node cập nhập địa chỉ MAC, ARP/ND và vỏng chuyển sang trạng thái được bảo vệ.

Trạng thái khôi phục liên kết

1. Khi liên kết được khôi phục, các node liền kề liên kết vẫn giữ trạng thái chặn và gửi gói tin R-APS(NR) đi để thông báo không còn liên kết lỗi.

2. Sau thời gian WTR timer, nút chủ RPL chặn RPL và gửi gói tin R-APS(NR, RB) đi. Vòng chuyển sang trạng thái tạm thời, chờ đến hết thời gian WTR.

3. Sau khi nhận gói tin R-APS(NR, RB), các node khác cập nhập bảng MAC và ARP/ND, và node đã gửi đi gói tin  R-APS(NR) dừng truyền trước đó sẽ dừng truyền gói tin định kỳ và bỏ cổng bị chặn. Vòng được khôi phục lại trạng thái bình thường.            

Ưu điểm phiên bản thứ hai G.8032 v2 Ethernet Ring Protection Switching

Phiên bản thứ hai G.8032 v.2 ERPS tiêu chuẩn hoá tránh độc quyền giao thức bảo vệ vòng, cho phép tốc độ phản ứng bảo vệ vòng nhanh hơn phiên bản đầu tiên.  Khi số nút mạng tăng lên, thời gian đáp ứng sẽ tăng từ 2-120 giây lên 5 phút sẽ là khoảng thời gian trễ không chấp nhận được. Điều này ảnh hưởng nghiêm trọng đến việc sử dụng và đáp ứng dịch vụ. Phiên bản ITU-T G.8032 v2 ERPS cho phép thời gian đáp ứng giảm xuống dưới 50 ms sẽ làm tăng đáng kể độ tin cậy mạng.

Phiên bản thứ nhất G.8032 chỉ hỗ trợ vòng đơn, phiên bản thứ hai hỗ trợ chuyển mạch khôi phục cho nhiều vòng (Multiple Ring) kết nối qua điểm liên kết, giảm chi phí triển khai bằng cung cấp mạng diện rộng đa điểm, giảm số liên kết.