CHAPTER 2 MULTIVARIATE CALIBRATION METHODS IN ANALYTICAL CHEMISTRY

หมวดหมู่: Translated book

บทที่  2

วิธีการคาลิเบรชั่นแบบตัวแปรพหุ ในเคมีวิเคราะห์ 

MULTIVARIATE CALIBRATION METHODS IN ANALYTICAL CHEMISTRY

 

บทนี้และบทต่อๆไปจะอธิบายเกี่ยวกับเบื้องหลังทางทฤษฏีของเทคนิคการคาลิเบรชั่นแบบตัวแปรพหุ โดยพยายามหลีกเลี่ยงเนื้อหาทางคณิตศาสตร์ของขั้นตอนต่างๆ อย่างไรก็ดี ขั้นตอนและการอธิบายอาจไม่เป็นเรื่องทั่วไปสำหรับนักวิเคราะห์บางท่าน และต้องการการเปลี่ยนแปลงทางความคิดบางอย่าง หน้าที่หลักของหนังสือนี้คือให้หลักการเชิงปฏิบัติของการพัฒนาวิธีการ (แบบจำลอง) แต่ความเข้าใจพื้นฐานเกี่ยวกับเบื้องหลังทางทฤษฏี สามารถช่วยให้เข้าใจเทคนิคการคาลิเบรชั่นแบบตัวแปรพหุ

A. การพิจารณาเชิงทฤษฏี (Theoretical Considerations)

เพื่อที่จะอธิบายเทคนิคการคาลิเบรชั่นแบบตัวแปรพหุ จะอธิบายขั้นตอนในการพัฒนาวิธีการเป็นอันดับแรก โดยทั่วไป วิธีการวิเคราะห์เชิงปริมาณทุกอย่างมีวัตถุประสงค์เพื่อหาสมบัติของระบบ Y  เป็นเชิงปริมาณจากพารามิเตอร์ที่วัดได้ของระบบ X  ซึ่งการวิเคราะห์นี้ ปกติต้องการขั้นตอน 2 ขั้นตอน คือการคาลิเบรชั่น (Calibration) และการวิเคราะห์ (Prediction) ในระหว่างการคาลิเบรชั่น จะต้องหาค่าความสัมพันธ์ (Correlation) ของค่าที่วัดได้ และ สมบัติของระบบ Y

ความสัมพันธ์นี้ถูกอธิบายในแบบจำลองคาลิเบรชั่น (Calibration) ดังต่อไปนี้


Y=X.b            (2.1)

 

โดยที่ ฟังก์ชั่นคาลิเบรชั่น b ซึ่งมักจะเรียกว่า regression coefficient หรือ b-coefficient สามารถแสดงได้ดังนี้

 

b=(XT.X)-1.XT.Y             (2.2)

 

สมการที่แสดงนี้ ตัวแปร X และ Y ถูกเขียนในรูปแบบเมทริกซ์ ในกรณีของการวัดสเปกตรัมนั้นระดับความเข้มของสเปกตรัมจะถูกเขียนในแถวของเมทริกซ์ X แบบจุดต่อจุด ตัวอย่างแต่ละตัวอย่างที่มีการเพิ่มเข้าไปเท่ากับว่าเป็นการเพิ่มแถวลงในเมทริกซ์ ค่าขององค์ประกอบที่ตรงกันจะถูกเขียนลงในแถวของเมทริกซ์ Y สำหรับ T แสดงถึงการทำ Transpose ของเมทริกซ์
หลังจากได้สมการคาลิเบรชั่นแล้ว จะวิเคราะห์ตัวอย่างใหม่ โดยการนำตัวแปร X ของตัวอย่างที่ไม่ทราบค่าแทนในสมการ เพื่อหาค่า Y สิ่งเหล่านี้สามารถแสดงได้เป็นแผนภาพในรูปที่ 2.1

ในกรณีการประเมินเชิงปริมาณด้วยสเปกตรัมเนียร์อินฟราเรด (NIR) หรือราแมน (Raman) โดยทั่วไปค่าที่ทำการวัดคือสเปกตรัมของการดูดซับหรือการส่งผ่าน ค่าตัวแปรที่ต้องการตรวจสอบคือความเข้มข้นของตัวอย่างที่ทำการวิเคราะห์ มีวิธีการ 2 วิธีของการสร้างสมการหรือแบบจำลอง หรือการคาลิเบรชั่น สำหรับใช้ในการตรวจสอบ โดยวิธีการแรกคือการสร้างแบบจำลองคาลิเบรชั่น แบบ ตัวแปรเดียว (Univariate) และวิธีที่ 2 วิธีที่ได้รับความนิยมกันอย่างแพร่หลายคือ การสร้างแบบจำลองแบบหลายตัวแปร (Multivariate)
รูปที่ 2.2 และรูปที่ 2.3 อธิบายขั้นตอนเกี่ยวกับการประเมินค่าตัวแปรเดียวของย่านการดูดซับคลื่นตัวอย่าง 5 ตัวอย่างที่มีความเข้มข้น  Cถึง C5 ถูกตรวจวัด   ค่านี้หมายถึงค่า Y   ค่าการดูดซับคลื่นมี 5 ค่า คือ Aถึง A5 คือ ค่า X (ดูจากรูปที่ 2.2 ซ้าย)

ในกรณีการคาลิเบรชั่นแบบตัวแปรเดียว  ค่าการดูดซับคลื่นที่จุดสูงสุดพล็อตกับความเข้มข้นของการวิเคราะห์ (ดูรูปที่ 2.2 ขวา) สมการที่เหมาะสมซึ่งถูกคำนวณจากข้อมูลการดูดซับและความเข้มข้น  ทำให้สามารถคำนวณค่าความเข้มข้นจากค่าการดูดซับที่วัดได้และกลับกัน

การวิเคราะห์ตัวแปรใหม่ที่ไม่ทราบค่า ทำได้โดยการวัดเชิงสเปกตรัมและหาค่าการดูดกลืนคลื่น Ap ที่จุดสูงสุด  ค่านี้จะถูกสัมพันธ์กับฟังชั่นคาลิเบรชั่น b ซึ่งจะถูกคำนวณไว้ก่อน และทำให้ได้ค่าที่ต้องการวิเคราะห์ (รูปที่ 2.3) ในกรณีของระบบที่มีองค์ประกอบเดียว มันเพียงพอที่จะประเมินค่าสเปกตรัมที่ความยาวคลื่นเดียว  การหาของระบบที่มีสององค์ประกอบ สามารถทำได้โดยการวัดความยาวคลื่นที่สอง  ซึ่งเป็นลักษณะของสารที่ต้องการวิเคราะห์ จากที่กล่าวมานี้ ระบบที่วิเคราะห์หลายองค์ประกอบจะสามารถถูกวิเคราะห์ได้โดยที่แต่ละองค์ประกอบที่เพิ่มขึ้นมา ปริมาณการดูดซับที่ความยาวคลื่นที่เหมาะสมที่เพิ่มขึ้นอีก 1 ความยาวคลื่นจะถูกเพิ่มเข้าไปในชุดคาลิเบรชั่น 

ในหลายกรณี  การคาลิเบรชั่นแบบตัวแปรเดียว มีความสามารถในการทำนายไม่เพียงพอ เนื่อง-จากมีข้อจำกัดหลายอย่างเช่น

-  ความเข้มข้นของสารสัมพันธ์กับจุดเดียวบนเส้นสเปกตรัม เพราะฉะนั้นเมื่อมีการประเมินตัว-อย่างที่ไม่ทราบค่าตัวใหม่ ทั้งข้อมูลที่ผิดปกติ (Outlier) และองค์ประกอบที่เป็นสิ่งรบกวนที่ไม่รู้มาก่อนสามารถถูกรับรู้ได้ หรือพูดได้ว่าจากความสูงของพีคหรือพื้นที่ของพีคจะไม่สามารถประมาณว่าโครงสร้างของสเปกตรัมที่วัดไว้สอดคล้องกับข้อมูลคาลิเบรชั่น ความแปรปรวนของสัญญาณทางสถิติ เช่น การที่ตัวตรวจวัด (Detector) ถูกรบกวน ถูกรวมเข้าด้วยกันกับข้อมูลความเข้มข้น ผลลัพธ์ของความไม่แน่นอนที่เกิดขึ้น โดยปกติต้องถูกทำให้มีค่าต่ำสุดโดยการวัดตัวอย่างหลายๆตัวอย่างแล้วเฉลี่ยผลลัพธ์นั้น

การสร้างแบบจำลองที่น่าพอใจของระบบหลายองค์ประกอบ ต้องการจุดยอดของพีคที่แยกกันอย่างเพียงพอ อย่างไรก็ตามในหลายกรณีก็ไม่มีทางเป็นไปได้ โดยเฉพาะอย่างยิ่งสำหรับเนียร์อินฟราเรดสเปกโทรสโกปี ในการวิเคราะห์ของระบบหลายองค์ประกอบจะสมมติว่าค่าการดูดซับคลื่นขององค์ประกอบทั้งหมดที่ความยาวคลื่นที่วัด จะเป็นการเพิ่มเชิงเส้น (กฎของเบียร์ แลมเบิร์ต) การพล็อตค่าการดูดกลืนแสงเปรียบเทียบกับความเข้มข้นนำไปสู่ค่าคาลิเบรชั่นฟังก์ชั่น b เป็นเชิงเส้น (ดูรูปที่ 2.2) ในหลายๆกรณี สิ่งนี้ไม่ถูกต้องสำหรับระบบจริง แรงระหว่างโมเลกุลหรือผลกระทบของอุณหภูมิสามารถนำไปสู่การบิดเบือนของช่วงคลื่นของสารที่ต้องการวัดนอกจากนี้ยังมีอีกหลายเทคนิคที่ กฎของเบียร์ แลมเบิร์ต ใช้ไม่ได้เช่นการวัดการสะท้อนแบบแพร่ (Diffuse reflectance) ซึ่งเป็นเทคนิคหนึ่งที่มักจะใช้ใน อินฟราเรดสเปกโทรสโกปี ดังนั้นการวิเคราะห์โดยใช้วิธีคาลิเบรชั่นแบบตัวแปรเดียวแบบดั้งเดิม อาจจะนำไปสู่ผลลัพธ์ที่ไร้ประโยชน์สำหรับระบบแบบหลายองค์ประกอบ วิธีการหนึ่งสำหรับการแก้ปัญหาดังกล่าวคือการใช้วิธีการคาลิเบรชั่นหลายตัวแปรเช่น Multiple Linear Regression (MLR), Principal Component Regression (PCR), หรือ Partial Least Squares (PLS)-Regression


B. PLS-Regression

การเปรียบเทียบวิธีการทางเคโมเมทริกซ์ที่ใช้ในเคมีวิเคราะห์สามารถพบได้ใน [1,3,4,5,6,7] อัลกอริธึมของ PLS ถูกสร้างขึ้นเป็นวิธีหนึ่งที่นิยมใช้มากที่สุด ดังนั้นจะอธิบายวิธีนี้เท่านั้น เนื่องจากขอบเขตและความซับซ้อนทางคณิตศาสตร์ของคำอธิบายทั้งหมดจะไม่ได้แสดงไว้ ให้อ่านเพิ่มได้ที่ [1,5,6,11เพื่อที่จะทำ PLS-Regression ของระบบใดๆ ข้อมูลของสเปกตรัมของสารต้องถูกเปรียบเทียบกับข้อมูลความเข้มข้นของสารนั้น การเปลี่ยนแปลงที่เกิดขึ้นทั้งในโครงสร้างข้อมูลทั้งสองต้องได้รับการยอมรับและมีความสัมพันธ์ซึ่งกันและกัน

สำหรับวัตถุประสงค์นี้จำเป็นต้องวัดตัวอย่างจำนวนมาก สำหรับการแสดงผลทางคณิตศาสตร์ของการเปลี่ยนแปลงทั้งในชุดข้อมูลทั้งสองจะต้องเขียนเมทริกซ์ของข้อมูล (ดูรูป 2.4) และ ไอเกนเวคเตอร์ ของข้อมูลเหล่านั้นจะถูกสร้างขึ้น ไอเกนเวคเตอร์เหล่านี้เรียกว่าแฟคเตอร์หรือองค์ประกอบเบื้องต้น ซึ่งสามารถใช้สำหรับการทำนายความเข้มข้นแทนสเปกตรัมดั้งเดิมเนื่องจากมันมีข้อมูลที่เกี่ยวข้องทั้งหมดของระบบที่ศึกษา การลดตัวแปรนี้มีประโยชน์อย่างชัดเจน ข้อมูลที่เกี่ยวเชิงการวิเคราะห์จากชุดข้อมูลขนาดใหญ่ได้ถูกบีบอัดเป็นแฟคเตอร์ซึ่งจะถูกใช้สำหรับการคาลิเบรชั่น

ในกรณีของคาลิเบรชั่น PLS ไอเกนเวคเตอร์จะถูกเก็บโดยเรียงลำดับจากมากไปหาน้อย แฟคเตอร์ แรกบ่งบอกถึงการเปลี่ยนแปลงหลักของสเปกตรัม มีความสำคัญที่มากที่สุดสำหรับแบบจำลองคาลิเบรชั่น และเมื่อจำนวนแฟคเตอร์เพิ่มขึ้นแม้แต่การเปลี่ยนแปลงเล็กน้อยในโครงสร้างข้อมูลก็จะถูกบ่งชี้ ซึ่งมีผลสำคัญที่ตามมาของการประเมินสเปกตรัม นั่นคือจำนวนแฟคเตอร์ที่น้อยลงส่วนใหญ่จะบ่งชี้การเปลี่ยนแปลงที่สำคัญของโครงสร้างของสเปกตรัม ขณะที่จำนวนแฟคเตอร์ที่สูงขึ้นส่วนใหญ่จะแสดงถึงส่วนที่เป็นสัญญาณรบกวนของสเปกตรัม

รูปที่ 2.4 ข้อมูลสเปกตรัมและความเข้มข้นในรูปแบบเมทริกซ์ ในตัวอย่างนี้มีตัวอย่างคาลิเบรชั่น M ตัวอย่างที่วัดและ - ในขั้นตอนที่สอง – N ความยาวคลื่นทั้งหมดของผลสเปกตรัมจะถูกเขียนในแถว (M, N) แมทริกซ์ เมทริกซ์นี้จะเทียบเท่ากับข้อมูลสเปกตรัมเมทริกซ์ X. ในทางเดียวกันค่าองค์ประกอบทั้งหมด L จะเขียนลงไปใน (M, L) เมทริกซ์ของข้อมูลความเข้มข้น

การเลือกจำนวนแฟคเตอร์ที่เหมาะสมเป็นความสำคัญกลางสำหรับคุณภาพของแบบจำลอง PLS ถ้ามีจำนวนแฟคเตอร์น้อยเกินไปโครงสร้างสเปกตรัมจะไม่ถูกรับรู้เพียงพอ regression ที่เกี่ยวข้องจึงไม่สามารถนำไปสู่การผลการวิเคราะห์ที่น่าพอใจ นั่นคือแบบจำลอง “underfitting”
ถ้าจำนวนแฟคเตอร์มีมาก การวิเคราะห์ก็จะไม่ดี เนื่องจากมีสัญญาณรบกวนเชิงสเปกตรัมหลายส่วนมากเกินไป (Overfitting) ใน PLS regression ข้อมูลสเปกตรัมเมทริกซ์ X และข้อมูลความเข้มข้นเมทริกซ์ Y ถูกลดลงเหลือเพียง 2-3 แฟคเตอร์ เมทริกซ์ดั้งเดิมจึงแสดงเป็นผลรวมของ A ผลคูณของสิ่งที่เรียกว่า scores vector ti กับ loading vector pi หรือ qi ตามลำดับ
          ข้อมูลสเปกตรัม:

X=t1p1T+t2p2T+t3p3T+...+tRpRT+F                               (2.3)

ข้อมูลความเข้มข้น:

Y=t1q1T+t2q2T+t3q3T+...+tRqRT+G                               (2.4)

ในทุกกรณี score และ loading จะแสดงเป็น vector ดูจากรูปที่ 2.5 ซึ่งอธิบายสมการ 2-33

ค่า R แสดงถึง จำนวน factor และ T หมายถึง Transpose ของแต่ละ loading vector  F และ G คือ เมทริกซ์ของ error (Residual metrices) ของ ข้อมูลสเปกตรัมและข้อมูลความเข้มข้น ตามลำดับ ค่าเหล่านี้สอดคล้องกับการเปลี่ยนแปลงโครงสร้างของข้อมูล ซึ่งไม่ได้คำนึงถึงในการสร้างแฟคเตอร์ (factorization)

ใน PLS regression เบื้องต้นข้อมูลจะถูกทำให้เป็นองค์ประกอบหลัก (Principal Components) แล้วจะคำนวณหา scores vectors จากข้อมูลสเปกตรัมและข้อมูลความเข้มข้น ซึ่งวิธีการจะครอบคลุม (Robust) ต่อความไม่ถูกต้องของค่าการวัดค่าอ้างอิงและการวัดค่าตัวอย่าง

โดยทั่วไป จำนวนสำหรับค่าการดูดซับที่ได้จากการวัดจะมากเกินกว่าตัวเลขขององค์ประกอบที่แสดงให้เห็น ดังนั้นระบบนี้คือ “over-determined” และจึงสามารถไม่เพียงแต่จะสร้างความสัมพันธ์กับจุดของข้อมูลสเปกตรัมจุดเดียว (เช่น จุดสูงสุดของการคาลิเบรชั่นแบบตัวแปรเดียว) แต่ยังมีความสัมพันธ์กับโครงสร้างข้อมูลสเปกตรัมทั้งหมด ข้อมูลชุดคาลิเบรชั่นด้วยวิธีนี้จะมีค่าข้อมูลที่ได้มากกว่าการคาลิเบรชั่นด้วยวิธีตัวแปรเดียวมาก นอกจากนี้ยังมีความเป็นไปได้ที่จะหาตัวแปรที่ผิดปกติ ในระหว่างการวิเคราะห์และสามารถตัดสินใจได้ว่าองค์ประกอบของสิ่งรบกวนที่ไม่รู้ค่า ซึ่งไม่มีความสัมพันธ์กับชุดของข้อมูล ทำให้เกิดการเปลี่ยนแปลงของสเปกตรัมตรงข้ามกับการคาลิเบรชั่นแบบตัวแปรเดียว เป็นไปได้ที่จะใช้ข้อมูลเชิงสเปกตรัมของด้านข้างของพีค ซึ่งสามารถวิเคราะห์สเปกตรัมได้โดยโครงสร้างของสเปกตรัมเอง ด้วยเหตุนี้แถบการดูดซับที่ซ้อนทับกัน  (overlapping bands) สามารถที่จะแยกออกจากกันได้ในสเปกตรัม ตราบใดที่มีความแปรปรวนในรูปร่างของสเปกตรัมน้อย8 ในทำนองเดียวกันสามารถรับรู้ถึงโครงสร้างของสเปกตรัมบริเวณที่มีสัญญาณรบกวนมากได้ ซึ่งนำไปสู่การปรับปรุงการทำนายความเข้มข้นสารให้แม่นยำ
ความสำคัญพิเศษของ PLS regression สำหรับการวิเคราะห์คุณสมบัติทางเคมี เกิดจากการสร้างแฟคเตอร์ (Factorization) ของข้อมูล X และ Y โดยไม่เป็นอิสระต่อกันและเกิดขึ้นพร้อมกัน เมื่อประเมินสเปกตรัมของการดูดซับสามารถที่จะประมาณว่าการเปลี่ยนแปลงของข้อมูลสเปกตรัมมีต้นกำเนิดจากความแปรปรวนของความเข้มข้นที่สอดคล้องกัน นั่นหมายความว่าการเปลี่ยนแปลงของข้อมูลสเปกตรัมควรจะนำไปสู่การเปลี่ยนแปลงที่สอดคล้องกันของสเปกตรัม เพราะฉะนั้น scores vectors ของเมทริกซ์ของข้อมูลความเข้มข้นและข้อมูลสเปกตรัมควรจะเหมือนกัน อย่างไรก็ตามในกรณีของตัวอย่างจริง ถ้าเมทริกซ์นั้นถูกลดขนาดลงโดยวิธีการทางคณิตศาสตร์อย่างบริสุทธ์ (นั่นคือเป็นอิสระ) ค่าความผิดพลาดในการเตรียมตัวอย่างและในวิธีอ้างอิงที่ใช้ในการวัดค่าความเข้มข้นและการเกิดดริฟท์ (Drift) ของเครื่องวัดและสัญญาณรบกวนในสเปกตรัมจะก่อให้เกิดความแตกต่างของ scores vectors ดังนั้นในวิธี PLS จะสมมุติว่า scores vectors ที่เหมือนกัน (Identical) สำหรับชุดข้อมูลทั้งสองที่จำนวนแฟคเตอร์ใดๆ ซึ่งจะถูกเลือกเมื่อค่าความคลาดเคลื่อนจากค่าเริ่มต้นมีค่าน้อยที่สุด เป็นการประนีประนอมระหว่างความเหมาะสมของแฟคเตอร์ที่ใช้ในการอธิบายตัวอย่างและความสัมพันธ์ที่เพิ่มขึ้นในระหว่างชุดข้อมูล

อัลกอริธึมที่มีชื่อว่า PLS1  เพียงแค่นำ ค่าความเข้มข้นของเพียงหนึ่งองค์ประกอบทางเคมีมาพิจารณา ข้อมูลอื่นๆ ทั้งหมดจะถูกตีความว่าเป็นสิ่งรบกวน นั้นคือ Y-เมทริกซ์ของข้อมูลความเข้มข้นเป็นเวคเตอร์เดียว ส่วนในอัลกอริธึม PLS2  ความเข้มข้นขององค์ประกอบทุกอย่างในระบบจะถูกนำมาพิจารณาในการคาลิเบรชั่น สำหรับการทำนายตัวอย่างใหม่แบบจำลองนี้นำไปสู่การวิเคราะห์องค์ประกอบทุกอย่างในเวลาเดียวกัน ตรงกันข้ามการคาลิเบรชั่นแบบ PLS1 ข้อมูลทั้งหมดของเมทริกซ์ความเข้มข้นจะถูกนำสัมพันธ์กันกับข้อมูลสเปกตรัมเมทริกซ์  โดยทั่วไปแล้ว การทำนายแบบ PLS2 จะให้ผลลัพธ์ที่เลวกว่าการทำนายแบบ PLS1 จากเหตุผลดังกล่าวโดยทั่วไปจึงแนะนำให้ใช้อัลกอริธึม PLS1 ในการวิเคราะห์ระบบที่มีหลายองค์ประกอบ อัลกอริธึมแบบนี้ก็สามารถถูกนำมาประยุกต์ใช้อย่างประสบความสำเร็จในทุกองค์ประกอบ ดังนั้นแบบจำลองที่สำหรับทุกองค์ประกอบที่ต้องการจะถูกสร้างขึ้นเช่นเดียวกับแบบอัลกอริธึม PLS2

 

 

 

 

[1] “The copyright is belong to Dr. Jörg-Peter Conzen”

30 กันยายน 2561

ผู้ชม 2747 ครั้ง

Engine by shopup.com