RULE語法
語法簡述如下:
; :為分隔符號。
{} : 註解
[ ] :AND,如:[上漲;下跌],文章中同時出現上漲和下跌時為True。
( ) :OR,如:(上漲; 下跌),文章中出現上漲或下跌時為True。
! :NOT,如:[上漲;!下跌],文章中只出現上漲且沒有下跌時為True。
_FuncName:有一個底線表示Function的名稱,若沒有加底線,則表示為Term
現已有的Function:
_EXIST(TYPE):存在指定Type的文章時為True,如:_EXIST(Y01),文章中存在台股代號這個類別。
_HITCOUNT(次數, Terms…):文章中出現不同指定Term的次數,如:_HITCOUNT(3, 上漲,下跌,本益比,營收,盈餘),文章中五個Term,出現3個以上時為True
_HITRATE (%, Terms…):文章中出現不同指定Term的比率,如:_ HITRATE (75, 上漲,下跌,本益比,營收,盈餘),文章中五個Term,出現75%以上時為True
_HITTIMES (次數, Terms…):文章中出現指定Term的次數,如:_ HITTIMES (5, 上漲,下跌,本益比,營收,盈餘),文章中五個Term的頻率,出現超過5次時為True
_TOP(TYPE,排名次):文章中出現指定排名以上的TYPE時為True,如:_TOP(Y01,2),文章中出現排名前兩名的Y01時為True。
_TOPCNT (次數,TYPE):文章中TYPE的最高排名最少出現多少次時為True,如:_ TOPCNT (5,Y01),文章中Y01出現最高次數的ID,最少出現5次以上時為True。
_TYPE (TYPE,次數):文章中指定TYPE出現不同ID多少次時為True,如:_ TYPE (Y01,3),文章中出現三種以上不同股票時為True。
_ TYPECNT (TYPE,次數):文章中指定的TYPE共出現多少次時為True,如:_ TYPECNT (Y01,5),文章中出現Y01的ID最少出現5次時為True。
以上的Function若不夠時,可以新增。
另又有選取的Rule(對應成UI為MatchTag),目前只有兩種,有需要時,可以再加:
1. 直接輸出指定的Tag ID
2. Group的方式。語法為 __Type(次數),前面為兩個底線。
如:__Y01 => 取得出現最多次的台股名稱。
__Y01(3) => 出現三次以上的台股名稱。
__ => 出現最多次的Type的Tag ID。
__(3) => 出現次數最少為3次以上的Type Tag ID
Example:台股股號
Rule:
[
_TOP(Y01,2);
_TOPCNT (3,Y01);
_HitTimes(10,成交量,EPS,本益比,營收,盈餘,出貨,基期,成長,衰退,YOY)
]
台股股號出現在前兩名,且次數大於等於5次,且有出現以下文字(成交量,EPS,本益比,營收,盈餘,出貨,基期,成長,衰退,YOY)10次以上時為True。
MatchTag:
__Y01(3)
群組編碼
Y01 台股股票名稱
Y02 港股個股股票名稱
Y03 A股股票名稱
Y04 B股股票名稱
Y05 日股個股股票名稱
Y06 韓股個股股票名稱
Y07 美股個股股票名稱
Y08 台灣期貨商品
Y09 權證名稱
Y10 選擇權名稱
Y11 國際期貨名稱
Y12 細產業名稱
Y13 基金名稱
Y15 基金公司名稱
PS:Y01表示台股代號這個類別。
PS:所有設定的” Term”,若有別名時,要以ID替換之,如:台績電(TW.2330),因為
這樣會把所有別名對應到同一個ID,若不是設定ID的話,台績電就只是”台績電”
並不表示是TW.2330。