群發消息類業務的廣泛應用,不僅為用戶提供了大量的有用信息,為政府部門提供了便利的宣傳渠道;同時也為商家拓展了便捷的廣告手段,為消息業務服務提供商帶來了巨額的經濟效益。但不可否認,目前群發消息通常沒有確定的發送目標,而多采取廣播式的發送方式,在很大程度上給用戶形成嚴重的騷擾。然而,用戶也沒有適合的方式來選擇需要的消息,只能被動盲目地接收消息。為使用戶可以有選擇地接收自己希望得到的消息,而不是被迫接收消息,我國特制定了YD/T 1902-2009《消息類業務內容分類技術要求》的通信行業標準,目的是在群發消息發出之前,就在消息中加入消息類業務內容分類代碼,進而用戶在接收時可以選擇接收需要的消息,同時屏蔽不需要的消息。基于消息類業務內容分類代碼的實施,不僅可以規范群發消息服務提供者相關行為,提升服務水平,還可以保護用戶免受垃圾消息的滋擾和侵害。同時,可以提升行業主管部門專業性監管能力,配合相關的監管策略,去莠存良,使群發消息類業務得以健康發展。
欲更多了解短消息中心設備技術要求的請進入。
YD/T 1902-2009描述了消息類業務內容分類總體技術要求,規范了消息類業務分類編碼方案和分類代碼表,并且對消息分類編碼在消息類業務中具體實施進行了具體技術規范。主要適用于消息業務提供商提供的群發廣告消息類業務,其他消息業務可參照執行。
一、總體要求
消息類業務最大的特點就是采用“主動發送,被動接收”的工作模式進行傳輸,用戶并不知道發送者發送的是什么內容的消息,在這種情況下只有被迫接收到以后才能判斷該消息是否是自己需要的。往往在這種情況下,用戶己經受到垃圾消息的騷擾。為了便于用戶有選擇地接收需要的消息,有必要通過技術手段最大限度地解決消息識別問題。
根據消息類業務的特點,解決消息內容識別并且進行分類最有效的方法就是在消息源頭使用合理有效的編碼方案對要發送的消息進行分類編碼,并且把相應代碼添加到消息體前面作為消息內容分類依據,從而保證所有消息具備消息內容分類特征以備后期識別判定使用。在現實生活中,消息類業務內容涉及社會生活的方方面面,制定出一套合理有效的編碼方案并不容易。為了確保該編碼方案可以真正滿足消息過濾業務的需要,制定消息類內容分類編碼方案應滿足下表1的原則性要求。另外,消息類業務中消息內容空間往往有一定限制,例如短消息業務內容代碼空間只有140個字節。故此,消息類業務內容的分類代碼要求盡量簡短。同時消息類業務內容分類代碼盡量使用等長代碼,這樣,消息過濾實體或者消息監聽實體就可以在不分析消息體內容的情況下,直接按照字節位直接讀取分類代碼進而識別消息類別。
表1:制定消息類內容分類編碼方案應滿足的原則性要求
二、分類編碼方案
消息類業務內容包羅萬象,涉及社會經濟生活的方方面面,而國民經濟行業分類是對杜會經濟活動進行的分類,是社會經濟行業劃分的基本依據。因此,基于國民經濟行業的分類是最適合消息類內容分類的分類方法。在進行國民經濟行業分類時候,通常采用經濟活動的同質性原則進行行業類別的劃分。即每一個行業類別都按照相同性質的經濟活動歸類,而不是單單依據行政事業編制、會計制度和部門管理歸類。根據國內外經濟實際情況,國民經濟行業分類適合采用線分類和分層編碼的方法,劃分為門類、大類、中類和小類四級,其各級的含義詳見下表2-1。門類分類結構成樹狀結構,其中,門類采用英文字母代碼,大類、中類和小類采用阿拉伯數字代碼。分類信息采用等長編碼,代碼長度總長為5,其編碼規則詳見下表2-2。相應編碼結構如圖2-1 所示,分類代碼與消息內容之間以空格作為分隔符。因此,分類代碼加分隔符一共占用6個字符的長度。
表2-1:行業四級分類的含義
表2-2:行業四級分類的編碼規則
圖2-1:行業四級分類的編碼結構圖
根據我國國民經濟情況,國民經濟生活可以分為20個門類, 97個大類, 473個中類, 1380個小類(2017版的數據)。具體分類代碼表詳見GB 4754第5 章,表2-3給出了門類代碼表。大類、中類和小類依據其歸屬的上位類而各有不同。圖2-2是以住宿和餐飲業(Ⅰ)為例進行的編碼劃分。
表2-3:門類代碼表
圖2-2:編碼劃分示意(住宿和餐飲業)
溫馨提示:GB 4754《國民經濟行業分類》的版本是在不斷更新的,目前已經歷了1984年、1994年、2002年、2011年和2017年5個版本,最新版本2017年版已于2017年10月1日實施。而YD/T 1902編制時是參照GB 4754-2002版本的數據,因此,在施行YD/T 1902時,應以GB 4754的最新版本為依據。若要詳細了解2017年版GB 4754的具體內容的請查閱下附件2。
附件2:GB 4754-2017《國民經濟行業分類》
三、分類編碼對消息容量的影響
短消息主要傳輸文本消息,有三種編碼方式(見ETSI GSM 03.40):7-bit編碼、8-bit編碼、16-bit編碼。7-bit編碼、8-bit編碼用于發送普通的ASCII字符;而16-bit編碼用于發送Unicode字符。由于短消息通常利用信令信道傳輸,受限于信令信道傳輸容量,短消息內容最多為140個字節,因此在這三種編碼方式下,可以發送的最大字符數分別是160、140、70。若要發送中文,必須采用Unicode編碼方式。中文短消息通常采用Unicode編碼,由于分類代碼加分隔符占用6個字節,故此在同一個短消息內還可以編寫67個中文字符或者134個英文字符。
欲詳細了解Unicode編碼技術的請進入。
多媒體消息可以傳輸文本、聲音、視頻等多種媒體,通常采用SMIL格式編碼。由于多媒體消息采用業務信道傳輸,故此傳輸容量較大,多媒體消息內容最多為100K個字節。但是分類代碼加分隔符占用6個字節,基本上可以忽略不計。
四、分類編碼實施
1、對消息業務提供商和消息業務運營商的要求
分類編碼的實施,首先應對消息業務提供商和消息業務運營商提出相應的要求,具體詳見下表4-1。其中業務運營商的分類代碼驗證示意圖如下圖4-1所示。
表4-1:對消息業務提供商和消息業務運營商的要求
圖4-1:運營商的分類代碼驗證示意圖
2、基于分類代碼的消息過濾業務實施
消息過濾系統應可以從消息提取分類代碼,并且利用該分類代碼對相應消息進行基于消息類型的消息過濾。相應基于分類代碼的消息過濾,既可以在前端業務接入設備(例如ISMG、WAPGW等設備)上實施;也可以在基于用戶規則消息過濾平臺上實施;還可以在用戶終端上實施。這三種情況的實施具體詳見下表4-2。同時,基于分類代碼的消息過濾業務實施既可適用于公共過濾(基于公共過濾規則的消息過濾),也適用于個性過濾(基于用戶規則的消息過濾)。
表4-2:基于分類代碼的消息過濾業務的實施
欲詳細了解基于用戶設置規則的消息過濾業務的請進入。
以上簡要的介紹了YD/T 1902-2009的技術要求的內容,若要詳細了解該標準具體內容的請查閱下附件4。
附件4:YDT 1902-2009《消息類業務內容分類技術要求》
欲進一步了解我國消息類服務接入代碼編號方案的請進入。
5.68MB
434.2KB