Browsing by Author "Chen, Po-Hsi"

Now showing 1 - 8 of 8

The subject-dependent, cumulative, and recency association of aerobic fitness with academic performance in Taiwanese junior high school students
(2019-01-17) Hsieh, Shu-Shih; Tsai, Jia-Ren; Chang, Shao-Hsi; Ho, Jen-Yu; Chen, Jui-Fu; Chen, Po-Hsi; Sung, Yao-Ting; Hung, Tsung-Min
Abstract Background The objective of the current study was to examine whether the relation between aerobic fitness and academic achievement during adolescence is subject-dependent, and to investigate cumulative and recency effects. Methods This study made use of two nationwide datasets. The first was the aerobic fitness profile of junior high school students collected by the Ministry of Education in Taiwan. The second contained the scores on the Basic Competence Test for Junior High School Students (BCTJH). The sample consisted of 382,259 students who completed the BCTJH in the 5 years between 2009 and 2013. Data on each student’s aerobic fitness during their three years of junior high school were matched with their exam results at the end of this period. Results The results revealed that students classified as highly-fit during at least one of the three years had higher BCTJH scores than those who never achieved this level, with the size of effect increasing with the length of time that fitness was maintained. Additionally, aerobic fitness in the final year was more closely linked to BCTJH scores than that in the earlier two years. Fitness was also more strongly associated with exam performance in math, science and social science, relative to language-related subjects. Conclusions Our findings suggest that while aerobic fitness is positively related to academic achievement in Taiwanese junior high school students, the relationship depends on academic subject, as well as the length and time of being aerobically fit.
以電腦輔助出題的台語詞彙測驗研究佮語法接觸調查
(2021) 林佳怡; Lim, Ka-I
因為歷史佮政治因素，多數台灣人以華語做第一語言。台灣各語言的發展無平等，親像其他的本土語言，台語的資源相對較欠缺，而且受著強勢華語的影響，台語當咧發生變化，沓沓仔倚向華語，甚至可能會影響台語測驗的標準。為著拓展台語測驗的發展面向，以及了解語法變化對台語標準化可能產生的影響，本文進行三項研究。第一，建立一套自動出題的方法佮程序，產出選項是漢字佮羅馬字兩種題型的詞彙測驗。以台語現有的資料庫做基礎，利用電腦程式自動產生詞彙測驗選擇題的題身佮選項，產出的題目由人工略仔修改了，以線頂的方式實際施測。第二，驗證出題方法的可用性，閣分析試題的難度特徵。收集作答反應以後，以古典測驗理論（CTT）佮試題反應理論（IRT）的Rasch model方法分析，來驗證試題可用性，才閣進一步共兩種題型中會影響難度的試題特徵揣出來。結果發現，本研究設計的出題方法佮程序，確實會當產出有鑑別度、也符合測驗單向度要求的可用試題。難度特徵方面，漢字選項題型的各種客觀特徵，攏較輸專家主觀判斷的結果；羅馬字選項題型有「題目台語特色詞的數量」、「誘答選項佮正答選項的聲調差異數量」兩項客觀特徵會當預測難度，專家判斷顛倒無準確。第三項研究轉向關注可能影響測驗標準的語法變化。整理受華語影響的台語語法，設計做語法接受度量表，kap入去研究一的線頂測驗，利用測驗的形式做語言調查的替代方案，來評估台語語法受華語影響的情形。結果發現，台語語序佮華語無仝的語法特色，受影響的程度較低，語序仝款、語法詞無仝的語法特色，受影響的程度較懸，甚至有錯誤語法的接受度比正確語法的接受度較懸的例。本研究的成果，開創台語測驗自動命題的研究，會當以較低的成本增加台語語言能力認證考試的題目數量，也會當予一般大眾初步判斷家己的程度適合報佗一个等級的考卷；另外，因應中學階段本土語納入必修課，研究成果也會當發展做教師判斷學生台語程度的工具。
分類目標與選題限制對於高階試題反應理論之電腦化分類測驗效能的影響
(2016) 張國豐; Chang, Kuo-Feng
本論文主要是應用高階試題反應理論（high-order item response theory, HIRT）於電腦化分類測驗（computerized classification test, CCT）情境中，探討分類目標、Fisher Information選題方法、切截點數以及最大測驗長度，對於高階試題反應理論之電腦化分類測驗（簡稱HIRT-CCT）效能的影響，以便對未來實行相關測驗方式上提供建議。研究採用三參數HIRT作為測驗模式，並以能力信賴區間（ability confidence interval, ACI）搭配暫時能力估計值為基礎的選題策略（estimated-based, EB）為分類方式下，比較三種分類目標（包括：以能區分二階潛在能力為分類目標、以能區分一階潛在能力為分類目標以及以能同時區分一二階潛在能力為分類目標）、三種Fisher Information（簡稱FI）選題方法（包括：使二階潛在能力訊息量最大法（FI2）、使一階潛在能力訊息量最大法（FI1）以及同時使一二階潛在能力訊息量最大法（FI1+2））、兩種切截點數（包括：一個切截點以及兩個切截點）以及四種最大測驗長度（一個切截點包括：15、30、60以及90題；兩個切截點包括：30、60、90以及120題）在HIRT-CCT的表現，並進一步探討當HIRT-CCT加入選題限制時（包括：試題曝光率控制以及內容平衡限制），對於分類測驗結果的影響。研究的依變項包括：分類正確性、平均測驗長度、最大試題曝光率、題庫使用率以及內容平衡（各內容所選題數百分比）。研究結果顯示，在三種分類目標中，以能區分一階潛在能力為分類目標所得到的結果與以能同時區分一二階潛在能力為分類目標所得到的結果相似，但若是以能區分二階潛在能力為分類目標時，則結果會與前兩者不同。此外，隨著最大測驗長度增加，一二階能力分類正確性均能有所提升。針對三種FI選題方法，在分類正確性方面，當使用FI2時，並不能有效提高二階能力的分類正確性；當使用FI1時，擁有最低因素負荷量的一階能力分類正確性能獲得提升（次高因素負荷量則保持不變或上升），但最高因素負荷量的一階能力分類正確性則會下降，不過隨著最大測驗長度增加，三種FI選題方法的分類正確性結果會趨於相同。在強迫分類百分比與及平均測驗長度方面，當以能區分一階潛在能力為分類目標或是以能同時區分一二階潛在能力為分類目標時，使用FI1的強迫分類百分比以及平均測驗長度最小；當以能區分二階潛在能力為分類目標時，則是使用FI2的強迫分類百分比以及平均測驗長度最小。在內容平衡方面，當使用FI1+2時，所選題目平均分布在各內容上；當使用FI2時，會傾向選出較多最高因素負荷量題庫的試題；當使用FI1時，則會傾向選出較多最低因素負荷量題庫的試題，不過隨著最大測驗長度增加，各內容所選題數百分比的差異會減少。此外，當最大測驗長度增加時，強迫分類百分比會減少，分類正確性、平均測驗長度以及題庫使用率則會提高。當切截點數增加時，分類正確性會降低，強迫分類百分比、平均測驗長度以及題庫使用率則會提高。在選題限制方面，當加入試題曝光率控制時，雖然可以有效控制最大試題曝光率，但會使分類正確性稍微下降，強迫分類百分比以及平均測驗長度稍微上升，題庫使用率則會大幅提升。當加入內容平衡限制時，雖然可以得到均勻的內容平衡，但會導致三種FI選題方法的效果變得沒有差異。整體而言，三種分類目標在一個切截點時，將最大測驗長度設為30且使用FI1+2選題方法；在兩個切截點時，將最大測驗長度設為60且同樣使用FI1+2選題方法，如此將有最佳HIRT-CCT表現效能。此外，當加入試題曝光率控制以及內容平衡限制時，除了能將試題曝光率控在設定的範圍內以及使所選題目平均分布在各內容上，並能有效提升題庫使用率，且對於HIRT-CCT效能的影響不大。
在不同資料型態下使用混合模型進行分析之程序探討
(2019) 蘇旭琳; Su, Hsu-Lin
本研究之目的為，探討在｢多因素潛在類別｣和｢多向度潛在類別｣情境下，分析連續和二元資料型態的正確程序。本研究以混合模型為基礎，提出不同分析程序，並在因素個數 / 向度個數、因素相關/向度相關、潛在類別個數、潛在類別分離程度各個自變項之下，檢視其對於模式選擇正確率、參數估計和分類結果正確性的影響，並將分析程序相互對照比較，選出最佳程序提供未來分析實徵資料之參考。結果發現，當各個潛在類別的因素不變性程度為強假設，並搭配訊息量指標作為模式判斷依據時，程序一：｢先判斷因素結構 / 向度結構，再判斷潛在類別個數，逐步決定最佳結果｣和程序三：｢假設不同潛在類別個數和不同因素結構 / 向度結構的組合，再判斷最佳適配模型｣的表現優於程序二：｢先判斷潛在類別個數，再判斷因素結構 / 向度結構，逐步決定最佳結果｣。此外，因素相關 / 向度相關和潛在類別分離程度是影響模式判斷正確率的重要變項。最後，作者針對未來研究和實務的應用提出相關建議。
評分者趨中效應指標表現效果探討
(2018) 邵越洋; Shao, Yue-Yang
本研究目的在於探討五種不同的指標在判斷評分者趨中效應程度時的表現效果並提出使用建議。本研究分成兩個部分，包含模擬研究及實證研究，模擬研究部分的三個自變項分別為五種不同的指標、評分者評分樣本數和評分者嚴苛度的程度；依變項為不同指標的準確性、敏感性以及不同指標基於的IRT模式在估計受試者能力值時的精準度。實證研究部分，分析不同指標在偵測評分者趨中效應程度時結果是否一致，並針對不一致的結果進行分析討論。本研究結果顯示無論評分樣本數多少，五種指標的準確性排序結果都相同。五種指標的表現效果會隨著評分樣本數的增加而愈好，且當評分者嚴苛度適中時，五種指標的表現均有所提升（相較於評分者是寬鬆或嚴苛時），在對受試者能力估計時，兩種模式存在一定差異。因此建議在判斷評分者趨中效應程度需使用何種指標依照評分樣本數和評分者嚴苛度作為判斷依據：當評分者樣本數較少時（例如本研究採50人），無論評分者嚴苛度為何，建議使用基於MFRM模式的r_(measure,res)和r_(exp,res)；當評分者樣本數較多時（例如本研究採100人），若評分者嚴苛度適中，則r_(measure,res)、r_(exp,res)、r_(score,measure)、SD和基於MF-RC模式的ω_k'均表現良好；但若評分者較寬鬆或嚴苛時，建議使用r_(measure,res)、r_(exp,res)和ω_k'。建議後續研究可以探討不同指標的切截分數。
跨向度轉換程序對多向度多階段適性測驗測量精準度的影響
(2022) 吳宜玲; Wu, Yi-Ling
多階段適性測驗（computerized multistage adaptive testing, MSAT）為電腦化適性測驗（computerized adaptive testing, CAT）的一種特例，它擁有CAT的優點，相較於線性測驗，可以使用較少的題數達到與CAT相近的測量精準度。本研究探討題間二向度MSAT與題內四向度MSAT，在不同跨向度轉換程序對於測量精準度的影響，分為三個子研究。研究一為提出題間二向度MSAT設計，在已知受試者樣本分佈狀態且向度能力間相關正確，分別使用單向度二參數對數模式（unidimensional two-parameter logistic model, 2PL）與多向度二參數IRT 模式（multidimensional item response model, M2PL）估計能力，研究發現M2PL模式測量精準較高。其次，在跨向度測驗的轉換程序，利用答對題數或迴歸模型進行適性，受試者的能力估計均方根差（root mean square error, RMSE）較小。研究二為提出題內四向度MSAT設計，在已知受試者樣本分佈狀態且向度能力間的相關正確，設計不同跨向度的轉換程序，研究發現利用迴歸模型進行跨向度的轉換程序時，當向度間能力相關程度越高，模板1–3–3–3的設計最佳，模板1–3–2–3的設計為其次，均優於無跨向度轉換程序的設計，受試者的能力估計RMSE較小。研究三探討當受試者樣本分佈狀態未知且不一定正確，不同能力組合之受試者進行題間二向度MSAT與題內四向度MSAT，對於測量經準度的影響。研究發現，在極端能力受試者的能力估計RMSE較大，而中等能力受試者的能力估計RMSE較小。當受試者能力越不符合向度間能力相關程度時，其能力估計RMSE越大。在進行多向度MSAT時，利用向度間能力的相關進行適性，可以有效的降低受試者的能力估計RMSE，受試者僅需作答部分的試題，就能達到良好的測量精準度，節省測驗時間。
金融人才性格測驗對工作績效、工作滿意與留任意願之效標關聯驗證─以P銀行為例
(2015) 張育菱; Chang, Yu-Ling
金融業是國家整體經濟之核心，其經營是否健全，對一國的經濟發展具有重大影響。由於金融從業人員的工作幾乎每日都要經手大筆金錢與客戶機密資料，具有高度之敏感性，因此，金融產業對於其業內從業人員之人格特質尤為重視，故運用人格測驗作為從業人員的篩選工具有其必要性。研究者所任職之財團法人台灣金融研訓院測驗中心，為使金融產業人才評鑑工具更臻完備，促進我國金融機構選才精確性與適切性，特與國立台灣師範大學心理與教育測驗研究發展中心合作，以國內金融從業人員作為常模，專為國內金融產業訂作專屬人格測驗─「金融人才性格測驗」，且為提供「金融人才性格測驗」有力之效度證據，本研究特與P銀行合作，採立意取樣方式，以P銀行櫃檯人員、帳戶管理員為研究對象，以「金融人才性格測驗」、「明尼蘇達工作滿意度短式量表」、「留任意願量表」以及個案銀行提供近三年績效考核分數作為研究工具，透過Pearson相關檢定、結構方程模式（Structural equation modeling, SEM）分析等研究方法，分析人格特質、工作績效、工作滿意、留任意願之間的相關性，並驗證本研究以明尼蘇達工作適應理論為基礎建構之各變項間關聯模式以及兩類目標職務適性特質，以了解「金融人才性格測驗」應用於個案銀行目標職務之甄選效度，以利提供該行進行目標職務甄選之參考指標。本研究共計分別發出208份研究測驗及問卷(含櫃台人員99人、帳戶管理員109人)，回收187份(含櫃台人員89人，帳戶管理員98人)，回收率90%。研究結果發現本研究以工作適應理論假設之人格特質、工作績效、工作滿意、留任意願關聯模型成立。其中，人格特質與工作滿意、工作績效、留任意願相關性顯著，且人格特質對工作滿意有顯著之預測力，並可透過工作滿意間接預測留任意願。此外，透過結構方程分析，P銀行櫃台人員主要適性特質為親和性、服務性、謹慎性；帳戶管理員主要適性特質為開放性、親和性、服務性。綜合上述，以P銀行櫃台人員、帳戶管理員為例，藉由「金融人才性格測驗」應可有效了解目標人員工作績效、工作滿意、留任意願情形，並可作為未來相關人員甄選時之參考指標。
青少年與青年學生在家庭互動、社會資本與心理健康之測量恆等性分析
(2022) 曾郁辰; Tseng, Yu-Chen
本研究目的旨在探究青少年與青年學生在家庭互動、社會資本與心理健康之測量恆等性分析，藉由不同年齡層的學生，將背景變項分為青少年與青年兩個群體，以檢驗兩個群體的測量恆等性。本研究資料來源為「臺灣貧窮兒少資料庫：弱勢兒少生活趨勢調查」。在研究對象上共計1,069人，青少年與青年學生分別575、494人，研究工具包含「家庭互動」、「社會資本」與「心理健康」量表，潛在變項之測量模型會先以驗證性因素分析確認效度，再透過跨群組恆等性檢驗，確認測量模型是否具備不同年齡層之測量不變性，最後採多群組結構方程模式進行分析，並探討各潛在變項在青少年與青年學生之差異情形。本研究結果呈現如下，首先，驗證性因素分析的結果顯示，家庭互動、社會資本與心理健康量表在青少年與青年學生上在效度與信度分別得到支持；其次，家庭互動、社會資本與心理健康之測量模型在青少年與青年皆具有測量恆等性；再者，家庭互動與社會資本對心理健康影響之多群組分析，在青少年與青年兩群體僅有形貌、結構係數與結構殘差具有測量恆等性，而在測量係數與測量殘差僅部分具有恆等性；最後，針對八個因素進行因素平均數的恆等性檢定時，呈現出個別因素在青少年與青年學生有差異；青少年在家庭凝聚、家庭資源、同儕互動與生活滿意度高於青年，但青少年在家庭支持與希望感的因素平均數低於青年。本研究茲就研究結果進行說明，並提出後續研究與應用的建議。