文档详情

数据挖掘WEKA实验报告2

m****
实名认证
店铺
DOCX
151.56KB
约7页
文档ID:177683872
数据挖掘WEKA实验报告2_第1页
1/7

数据挖掘-WEKA实验报告二姓名及学号:杨珍20131198班级:卓越计科1301指导老师: 吴珏老师一、 实验内容1、分类算法:(掌握weka中分类算法的使用)1) 掌握决策树分类算法(C4.5, CART算法)2) 打开数据集weahter.nominal.arrf,使用C4.5分类器(C4.5算法在Weka 中是作为一个分类器来实现的,名称为J48)构建决策树3) 对结果进行分析4) 使用贝叶斯网络编辑器编辑贝叶斯网络选做)二、 实验步骤⑴打开数据集 weahter.nominal.arrf查看: Citii一前I◎ breast-cancer,arff◎ segment- ch al len ge,a rff◎ con t 日 日勻 eirff◎ se gment-ts st. arff◎ cpu.BrffQ ^oybe-an.arffQ epu .with.ver de r.arffQ eu perma rket & rffO crrdit-g.arFf◎ unbalanced,a rffQ diabetes;.arffQ vote, a rffO gla^s.ar+fQ ioncEphere.arff◎ iris.2D.arff◎ iinE.arffQ labar.airffQ ReutersCorn-v TB.-J--X 3EU.L3E1:^X: Cb3=-JAli:E -=::ZJ4ax m.i£. jqEJiiZad vcr-3= 治駅冋4甞fltMf1MT M-LKL»« 9;£Ted "MPCPHZEEa: OlE E<3C? 91 I 93 IbTlJ:咗h: :cL- £C|.3C mt 'iZ'i'SE2.4LK'JIL.JM1 h■1 H34 L时点們ha亡斗 in《阿w .-.iridnva 呂!陀 buifeiC1C55 一-Ddckroull bufTnn- ruuk.yj:a .tnF .54Hr HEA3UTCtX 1341Tl£ 2xcaCLasad.lbl].出-1 J41B.anO.-lbi■>U-M・-1. Mlr .-553C.&5I[■.ICQ I*.他闘聽a>odclKt beIuj model 卷Ji cutbc L tc^i kLRo ofipk'^hi5 model's CDnliqur^iionUL-Udlixti L'-WAlHtJIuLujIixc LiwVh-iJriliia nH-0n curve- chr^Kh^ldcufw r ^lyf^wis^E 1 Jhrud*严 io.V e皆口irx6*J48的决策树可视化结果:I亠 Weka Classifier Tree Visualizer: 08:39:11 -廿巳」1=1 丨回 l・^MTree View:laak=sunny=overcast=rainyhumidityy&s (4.0)-high - normal= TRUE = FALSE⑶采用FilterClassifier构建决策树Freprccess Classify Cluster Associate Selecl attribulEE VisualizeCl as sifier»ek^ Er- h cldislfiers.a- £11 tersB supervisrd- attribute. Discrrtire 一R first-last,bayes-functions;lazy卜• IdaBooE; tMlsi fler outputAttri bot e Sei 亡 亡 dC lassi fi Bia 若 giagClassiflcatiDnViaF.egressi CostSensitiveCl assifier CVParam et orS election空旳 sc[uaM4 esrarLivt aletros ze Native aqiiar^l Ezrar rsage- af 匚ases [D_ 95 IfjielJ ” reL. regi&n size iD・§石 1-evbI]0«5984n/ *121.25S7 17E.5714 %6^„2S57 龟lteredCla5ElJierLogitBoostMui tiClas sCl ass If 1 er■ul tiClas sCl bs^ ifi erUpda t lultiSchemeRando&ConnL1 teeRandoiizableFilteredCLass BandanSubSpa 匚 u Resres s l onBvDi s Stacking If jx 丰 in1 Fuiriberof Instan&ea14DetailedAccu re cyClc» =TP Ra怙FP MsPrecisionRwftliF-He-aiMC0.5560. €2$0.5&40.5tB0-.4DQ0.4440.4 DEI6自硏眦Av-g□ ,&0D0-.5440.9210.5D0C,5»CDR.fj3iQn KarridcI a - yesFilterClassifier 的数据结果Ttfi: CptlOES■.f Tse- tralnlnE setZl^sslILei <>UTpL.t- T+5Zlarj^faJiE- K=-dil JP pmwi pzttmeutlaoi- - btikifhir-srf-tT F tug: t= |1.4; hTKrdrrf - hTTHAi : I..? . [ IwtLaai - e ri.01□utlcoJi ■ raangfI HlHltF - WEf TOI 窃-ETdJEi 牡三 idiCiJUBMT Df LeiVH I tJiev dE 也・ u*«a : EiT.lu- idiax E9 lu丄Li ec-^iI: 4 jazzedrCoEnctl^ ELuil£L«d X・NrB=" 73rr=amn3y {TLada Lf.l«^ :muai=-hKiem JuttatLE « 9.4421Mi-BE. 4-TEDE 2 .船厂輛 邓!trcM1 ■■Sftire-ti cpiLciifT:i亡 Hdjj^Liif lei.« ^Lpplld tW5d S«1* Crg■-¥■*]Lit勺 Lem Idrl? LOFwctfiitiit-!- ipLltHore opiiEU …■ I-3i I pLujrtar j t r I ab — i l . — i e .nrl r . . I r »=_ t .as mJ . — ■ - : " ;-jt* ■ . I r-i i K'U ar l/ ■ rr- ■ aiLI. ■ rfa ・« - ■ i i i rr -A I ■ r ir< - f .-si r 1 " - ■ wuiueizfaeira9^HilLC!11h-uW^jrMlEXiT■Ju! ej = ae-'.'dl:: ir.二也-aer ・-u;pji :l・kanav iBelin job i::raE«=-%?rTLrm»iT»rr mis :3ififit^rlhUE'l- 皿■他 UM-EUIE , 1*%鬥■ mbU" LI^M-AECX^ IhCCrH^la, =h=L jfi^ratonEi- Ih-sti, Mrra*l.|?R«r?tan» Mirwtr LTIUfl.rRLSIfI^EibUEIi f3*-|I p^IHrnE]f XM~I⑷使用贝叶斯hrmrocras: f fy | £^m ter AaaaciGftc | ddc-cl <=H3ft3 r-# r ■' - - '4.> ll.iv'lB&T'iFBNul 1 I HDCia] r*「ftUKTlm'-b KE*:X k Fl!< b ruL<5Ju甲RImHllJ岀is^"E. Iwy>c. n►- K7 -■ -T i -5: KtITIS _R wk». r] r- -1 fl h?T*~- r*"> - *= rlisi-^. ^Inpi ^K^r'jnsT-r j 口円HHvfiiFr iyjtjail■V K.K iri-raiTUC3ijdi -BH*^ikL.-=.imLLiEr^fc!-h:Ri .disYuJi^ -3 -43 hvei .e^milzmui f: =■: .rcu:t.l5c>5«_ .KZ-U 1 -5 t!L'i££3 -E ^ici:r.iaiLZ^«si .m.^i. ::«r:u;:•:止j==;fvbl'wll[^Dip«riEanr lac-UtTXJWFCLiaiuivE umI |±uL_ E:uru.4j as:»lLE- 7-iUl I'ufiU -hUI IdhEltfiL!i*U 21IEWU :Lbf>Lt3C7X d£"il-knjiLLwx: HlJjLM.EdrR'-]° = . °. i I " i I . ' ■ i :.xn:蚪即;piiYovcr-aswcCil i nl,-w j».di.Eri! : FL*yFl!呼曲IY |XU]|FJ■『炉MLJFSaeri hL^>j: -4!9„>]111.'?LJ!i9&U.L9M>*.- WM址:却LiMiMEL3f^O3H WCl -G:-. -'LGiiKLlJa-IU-S^USCXI Ul£wC.a3 : -bL .Kd.UJ.4Mr^ Ld」JU山-;E.甲:AE贝叶斯的可视化结果:[g」Weka Classifier Graph Visualizer; O9;S1;44 -.,,.思考与分析使用FilterClassifier和J48,并采用有监督的二元离散化,与只使用J48处理原始数据的结果想比较。

为何从离散化后的数据构建决策树,比直接从原始数据构建决策树,有更好的预测效果?⑴算法需要,例如决策树,NativeBayes等算法本身不能直接使用连续型变量,连续型数据只有经过离散化处理后才能进入算法引擎⑵离散化可以有效地克服数据中隐藏的缺陷,是模型更加稳定⑶有利于对非线性数据关系进行诊断和描述:对连续型数据进行离散化后,自 变量和目标变量之间的关系变得清晰化。

下载提示
相关文档
正为您匹配相似的精品文档