APPENDIX

หมวดหมู่: Translated book

ภาคผนวก

คำถามที่พบบ่อยๆ

จากประสบการณ์พบว่าแม้แต่หลังจากการศึกษาเคโมเมทริกแล้ว จะยังมีปัญหาเกิดขึ้นในการทำงานประจำวันซึ่งผู้ใช้ควรจะแก้ไขปัญหาโดยใช้ความเชี่ยวชาญและความชำนาญ ต่อไปนี้เป็นคำถามที่พบบ่อยๆซึ่งจะช่วยให้ผู้ใช้สามารถใช้เนียร์อินฟราเรดสเปกโทรสโกปีในการทำงานในห้องปฏิบัติการได้ดี

1. จะต้องใช้ตัวอย่างจำนวนเท่าไรสำหรับการสร้างแบบจำลอง PLS
มันขึ้นกับการประยุกต์ใช้งานเป็นอย่างมาก แบบจำลองควรจะสะท้อนความแปรปรวนโดยธรรมชาติทั้งหมดของระบบที่ต้องการวัด ถ้าการประยุกต์ใช้มีความซับซ้อนมากจะต้องใช้จำนวนตัวอย่างที่แตกต่างกันจำนวนมากเพื่อที่จะครอบคลุมความแปรปรวนทั้งหมด นอกจากนี้ยังมีอิทธิพลที่เกี่ยวข้องกับอุณหภูมิที่แตกต่างกัน ขณะขนาดของอนุภาคของแข็ง ปริมาณความชื้น เป็นต้น การประยุกต์ใช้ที่ง่าย เช่น ของผสมของของเหลวอินทรีย์ที่ใสต้องการประมาณ 20 ตัวอย่างขึ้นไป ในขณะที่การประยุกต์ใช้ทางปิโตรเคมีหรือผลิตผลในธรรมชาติ เช่น ข้าวสาลีอาจต้องการชุดตัวอย่างตั้งแต่หลายร้อยตัวอย่างถึงหลักพันตัวอย่างทีเดียว
ในบริบทนี้มีความสำคัญที่จะครอบคลุมช่วงความเข้มข้นทั้งหมดอย่างสม่ำเสมอกัน ประสบการณ์ได้ชี้ให้เห็นว่าผู้ใช้จำนวนมากเริ่มเก็บตัวอย่างมากเท่าที่จะเป็นไปได้ก่อนที่จะเริ่มสร้างแบบจำลอง มีงานจำนวนมากได้ลงทุน ลงแรงไปแล้วมารู้ภายหลังว่าสเปกตรัมจำนวนมากมีข้อมูลที่ซ้ำซ้อนและไม่ได้เพิ่มคุณค่าให้แบบจำลองเลย ดังนั้นจึงขอแนะนำว่าควรสร้างแบบจำลองเบื้องต้นในระยะแรกก่อนเพื่อว่าตัวอย่างต่อไปสามารถเลือกวัดได้อย่างเฉพาะเจาะจงมากขึ้น

2. ทำไมฉันไม่สามารถสร้างแบบจำลองโดยใช้จำนวนตัวอย่างเพียงเล็กน้อย
PLS เป็นวิธีการทางสถิติ การใช้จำนวนตัวอย่างเพียงเล็กน้อยทำให้ไม่สามารถได้ค่าทางสถิติที่น่าเชื่อถือ การทดลองความคิดที่ง่ายสามารถแสดงให้เข้าใจได้ เช่น ถ้าสมมติ NIR สเปกตรัม (spectrum) เส้นหนึ่งประกอบด้วยจุดข้อมูลประมาณ 1,000 จุด ซึ่งจะมีส่วนประกอบสเปกตรัมต่างๆซึ่งพอดีกับค่าความเข้มข้นที่กำหนดโดยไม่ตั้งใจถ้ามีจำนวนตัวอย่างเพียงเล็กน้อย ความสัมพันธ์ที่แท้จริง (ตามหลักฟิสิกส์ที่แสดงเหตุผลอันสมควร) ระหว่างข้อมูลสเปกตรัมกับค่าความเข้มข้นจะไม่สามารถพบได้จนกว่าจำนวนตัวอย่างที่มากพอจะถูกเก็บรวบรวม ชุดตัวอย่างที่มีมากกว่า 20 สเปกตรัมจะมีความน่าจะเป็นทางสถิติของความสัมพันธ์โดยบังเอิญมีแนวโน้มที่จะเป็นศูนย์ ดังนั้นการคาลิเบรชั่น (Calibration) หรือการศึกษาความเป็นไปได้ที่มีเพียง 5 หรือ 6 ตัวอย่างในความคิดของฉันไม่ถูกต้อง

3. มันเป็นไปได้หรือไม่ที่จะสร้างสเปกตรัมสังเคราะห์ในการคาลิเบรชั่น (Calibration) ตัวอย่างเช่น โดยการรวมกันทางคณิตศาสตร์ของสเปกตรัมองค์ประกอบบริสุทธิ์ โดยใช้เครื่องคิดเลขคำนวณสเปกตรัม (spectra calculator)
ไม่ สเปกตรัมจริงของของเหลวหรือของแข็งไม่สามารถสร้างขึ้นโดยง่ายโดยการบวกหรือการลบของสเปกตรัมดิบ (ตัวอย่างเช่น สเปกตรัมองค์ประกอบบริสุทธิ์) นอกจากนั้น มันเป็นไปไม่ได้ที่จะจำลองความแปรปรวนทางธรรมชาติของระบบจริงด้วยคณิตศาสตร์

4. มันเป็นไปได้หรือไม่ ที่ใช้ตัวอย่างที่ทำในห้องปฏิบัติการ เพื่อทำให้จำนวนของตัวอย่างมากขึ้นโดยสะดวกสบาย
เป็นไปได้ ถ้าตัวอย่างของห้องปฏิบัติการเป็นตัวแทนความแปรปรวนทางธรรมชาติของระบบจริง และนี้คือความยากลำบาก มีระบบจริงจำนวนน้อยที่สามารถจำลองภายใต้สภาวะของห้องปฏิบัติการ ที่ง่ายที่สุดที่จะได้รับการคาลิเบรชั่น (Calibration) ที่ครอบคลุม (Robust) คือ การเก็บตัวอย่าง (Spectrum) การคาลิเบรชั่น (Calibration) ที่เป็นตัวแทน และการวิเคราะห์ด้วยวิธีการอ้างอิงตามลำดับ
89

5. ฉันสามารถใช้ต๊อกมาตรฐานหรือชุดการเจือจางได้หรือไม่?
ไม่ได้ สต็อกมาตรฐานเพียงแต่มีระดับความเข้มข้นของสารที่วิเคราะห์ต่างกันแต่ไม่ใด้รวมความแปรปรวนขององค์ประกอบอื่นหรือลักษณะเนื้อของสาร (matrix) อื่น สต๊อกมาตรฐานสามารถใช้ได้ต่อเมื่อมีตัวอย่างเพียงพอที่เป็นตัวแทนของความแปรปรวนทั้งหมดของระบบ ซึ่งสต๊อกมาตรฐานนำมาใช้เพียงแค่ทำให้ช่วงการคาลิเบรชั่นมีค่าการวัดมีความสม่ำเสมอ การใช้สต๊อกมาตรฐานเพียงอย่างเดียวเป็นไปได้ถ้าตัวอย่างมีความแปรปรวนที่เป็นไปได้ทั้งหมดขององค์ประกอบทั้งหมด ซึ่งเป็นกรณีที่เกิดขึ้นได้ยากมาก การใช้ชุดการเจือจางเป็นการไม่เหมาะสมอย่างยิ่ง โดยการเจือจาง ทุกค่าความเข้มข้นเปลี่ยนอย่างเป็นสัดส่วน (Collinearly) (คือในทางเดียวกัน) ขั้นตอน PLS นั้นจึงไม่สามารถแยกความแตกต่างระหว่างการเปลี่ยนแปลงขององค์ประกอบและการเปลี่ยนแปลงของ matrix ส่งผลให้การคาลิเบรชั่นนั้นใช้ไม่ได้

6. สำหรับการประยุกต์ใช้ของฉัน มันเป็นไปไม่ได้ที่จะครอบคลุมช่วงการประยุกต์ใช้ทั้งหมดด้วยตัวอย่างที่มี นั่นคือ มีค่าความเข้มข้นหรือ ค่าพารามิเตอร์ที่ไม่มีในความเป็นจริง ฉันควรทำอะไร?
มีความเป็นไปได้หลายอย่าง:
- การคาลิเบรชั่นทำขึ้นจากตัวอย่างที่มีเท่านั้น อย่างไรก็ตามมันไม่น่าเชื่อถือมากสำหรับช่วงที่ว่าง “empty” ของการคาลิเบรชั่น สิ่งนี้เป็นที่ยอมรับถ้าในชีวิตจริงไม่มีตัวอย่างในช่วงนี้เลยและ/หรือถ้าการวิเคราะห์ในช่วงนี้ไม่สำคัญ นอกจากนี้ การคาลิเบรชั่นในช่วงให้ผลดีซึ่งตรงกันข้ามกับนอกช่วง
- ตัวอย่างที่ขาดถูกทำขึ้นในห้องทดลอง โดยมีข้อแนะนำให้ผสมตัวอย่างจริงจากช่วง (สุดโต่ง) ต่างๆ ของการคาลิเบรชั่นแล้ววัด ส่งผลให้ได้ตัวอย่างที่สร้างขึ้น แต่มี matrix ดั้งเดิม
- สร้างการคาลิเบรชั่นขนาดเล็กหลายๆแบบจำลองในช่วงที่มีตัวอย่าง

7. มีช่วงความถี่หรือวิธีการจัดการสเปกตรัมเบื้องต้นที่โดยทั่วไปให้ผลดีหรือไม่
- ผู้ใช้ที่แตกต่างกันจะให้คำตอบที่แตกต่างกันอย่างแน่นอน บริษัทผู้ผลิต NIR Spectrometer ที่มีชื่อเสียงใช้ช่วงสเปกตรัมทั้งหมด (Full-spectrum) และ 1^stderivative เป็นขั้นตอนมาตรฐาน แนวทางนี้ข้อมูลสเปกตรัมทั้งหมดถูกใช้ และ ด้วย 1^st derivative ทำให้การขยับขึ้นของสเปกตรัม (baseline shift) ลดลง อย่างไรก็ตามแนวทางนี้ การรบกวนของแถบการดูดซับคลื่นของพันธะของน้ำไม่สามารถถูกกำจัดไปได้และการทำ derivative มักจะทำให้มีสิ่งรบกวนสเปกตรัม (Spectral noise) หรือการ drifts ของเครื่องวัดที่เกิดขึ้นที่ สเกลของความยาวคลื่น ฉันมักจะคิดว่า การคาลิเบรชั่นแบบ PLS เป็นเหมือนกล่องดำ “Black box” นั่นคือ ฉันเลือกชุดของแบบจำลองด้วยพารามิเตอร์ที่เหมาะสมก่อน (pre-optimized parameters) เมื่อเวลาผ่านไปหลายสัปดาห์ต่อมา แบบจำลองถูกทดสอบด้วยตัวอย่างจริง การตัดสินใจสุดท้ายสำหรับแบบจำลองที่ได้ทำขึ้นหลังจากที่ฉันได้พัฒนาความรู้สึกสำหรับอิทธิพลของการรบกวนทางธรรมชาติต่อความแม่นยำของการคาลิเบรชั่นและฉันสามารถเลือกแบบจำลองที่ดีและครอบคลุมที่สุด ฉันหยุดที่จะขึ้นกับความชำนาญในการวิเคราะห์ของฉันเมื่อต้องประมาณความครอบคลุมของแบบจำลอง PLS จากชุดตัวอย่างอื่น (ดูคำถามที่ 9 ด้วย)

8. แต่ฉันจะจัดการกับบริเวณที่ไม่แสดงการดูดซับคลื่นใดๆ (baseline) หรือกับแถบการดูดซับคลื่นที่ไว (sensitive) ต่อการรบกวนอย่างการสั่นสะเทือนของพันธะ OH ที่ 5,200 cm^-1 และ 6,900 cm^-1 ซึ่งขึ้นกับอุณหภูมิ อย่างไร
- เป็นเรื่องที่ชัดเจนว่าบริเวณซึ่งแสดงการดูดซับทั้งหมดหรือมีการรบกวนสเปกตรัมรุนแรงไม่ควรถูกรวมไว้ในการคาลิเบรชั่น โดยทั่วไปสิ่งเหล่านั้นให้ผลที่เลวลง คำแนะนำอื่นๆ โดยทั่วไปไม่สามารถเป็นไปได้ แม้ว่าถ้าการเห็นครั้งแรกมองแล้วน่าจะมีเหตุผลในเชิงวิเคราะห์ว่าไม่ควรใช้บริเวณที่ไม่แสดงการดูดซับคลื่นใดๆหรือแสดงน้อย (baseline) หรือ แถบการดูดซับคลื่นที่ไวต่อสิ่งรบกวน (interference-prone band) แต่มันไม่ฉลาดเสมอไปที่จะตัดบริเวณเหล่านั้นออก มีหลายการคาลิเบรชั่นซึ่งจำเป็นต้องใช้ baseline ในการระบุและชดเชย ตัวอย่างเช่น baseline drifts และบางทีแถบการดูดซับคลื่นที่ไวต่อสิ่งรบกวนมีข้อมูลที่เกี่ยวข้องกับการประยุกต์ใช้ที่ต้องการเป็นอย่างมากแม้ว่าจะไม่ปรากฏบ่อยนัก
- ในบริบทนี้ การแพร่ของไอน้ำรอบๆ เข้าไปในสเปกโตรมิเตอร์เป็นสิ่งสำคัญมากในเทอมของเสถียรภาพ ระยะยาวของการคาลิเบรชั่น ในรูปที่ 5.3 สเปกตรัม NIR ถูกเปรียบเทียบระหว่างการวัดด้วยเครื่องมือซึ่งด้านในแห้งสนิท และการวัดด้วยเครื่องมือที่ความชื้นโดยรอบสามารถแพร่ไปด้านในได้การเตรียมตัวอย่างในการวัดด้วยเครื่องมือขององค์ประกอบแห้งภายในของวัสดุทั้งหมด ความชื้นในบรรยากาศจะสามารถกระจายเข้าไปภายใน ซึ่งสามารถแสดงได้จากการวัดด้วยเครื่องสเปกโทรมิเตอร์สองเครื่อง จะแสดงการดูดกลืนแสงของไอน้ำ (7500 - 6700 ซม. ^-1 และ 5800-5000 ซม. ^-1) ทั้งคู่ได้ถูกใช้อ้างอิง ซึ่งปัญหามีเพียงเล็กน้อย ในโลกของการวัดตัวอย่างด้วย NIR การวัดจะไม่มีความชื้นภายใน จึงมีความจำเป็นที่จะต้องวัดร่วมกับสเปกโทรมิเตอร์ที่ปิดสนิทและแห้ง แต่เนื่องจากการแลกเปลี่ยนไอน้ำเป็นก๊าซที่มีบรรยากาศโดยรอบ จะพบพีคเล็กๆ เพิ่มขึ้นในสเปกตรัม เห็นได้ชัดว่าผลที่ออกมาต่ำมาก ถ้ามีการวัดตัวอย่างได้ทันทีหลังจากการอ้างอิง แต่ถึงแม้ว่าผลที่ออกมาดูเหมือนจะเล็กๆ น้อยๆ (และไม่สามารถมองเห็นได้อย่างชัดเจน ในสเปกตรัมหลังจากที่การอ้างอิง) จะมีอิทธิพลต่อความสัมพันธ์ของสมการ calibration ค่อนข้างสูง PLS algorithm ส่วนใหญ่มาจากการเปลี่ยนแปลงในสเปกตรัม คือ รูปร่าง โครงสร้าง สเปกตรัมของตัวอย่างที่คล้ายกับไอน้ำ ซึ่งมีอิทธิพลต่อความสัมพันธ์อย่างมาก และจะดีกว่าการแก้ปัญหาด้วยการเลือกสเปกตรัม ซึ่งอาจจะเป็นผลที่แย่กว่า ดังนั้นจึงขอแนะนำให้ลบความถี่ทั้งหมดออกไปจากชุดสมการ calibration ซึ่งรวมเป็นกลุ่มของการดูดซับด้วยน้ำ ซึ่งสิ่งนี้เป็นจริงถ้าการวิเคราะห์อยู่ในช่วงความสัมพันธ์ ส่วนใหญ่เกิดขึ้นในเครื่องมือทางการเกษตร ของน้ำหรือโปรตีนที่จำเป็นต้องได้รับการพิจารณา โดยเฉพาะอย่างยิ่งในการสร้าง calibration สำหรับค่าความชื้นของตัวมันเอง (เช่นปริมาณไขมันในตัวอย่าง) กล่าวได้ว่า priori ไม่สนใจเหตุผลเกี่ยวกับการดูดซับคลื่นของน้ำ
อย่างไรก็ตามสำหรับโปรตีนที่มีความถี่เพียงพอที่จะรับประกันได้ว่าข้อมูลทั้งหมดสเปกตรัมมีความเกี่ยวข้องที่อยู่ภายในของสมการ calibration ความถี่ของโปรตีนในไอน้ำเป็นข้อมูลที่ซ้ำซ้อนนั้น เช่นเดียวกับช่วงที่เป็นจริงสำหรับสมการ calibration ในตัวอย่าง ทั้งนี้ซึ่งของเขตสำหรับปริมาณการดูดซับของไอน้ำเพียงพอกับข้อมูล ซึ่งเป็นการประกันระยะห่างอิสระของการวิเคราะห์ ได้รับการทดสอบก่อนการศึกษาจำนวนมากของสมการ calibration ซึ่งส่วนใหญ่หลีกเลี่ยงการรวมตัวกันของไอน้ำ จะทำได้ดีกว่าแบบอื่น ๆ ในแง่ของความเสถียรภาพ แม้ว่ามีขนาดเล็กกว่าช่วงความถี่ที่ได้รับการเลือก
ดังนั้นช่วงความถี่ของแถบการดูดซับคลื่นของไอน้ำดูเหมือนจะเป็นความเสี่ยงต่อการหลับอยู่ (Sleeping risk) สำหรับการคาลิเบรชั่นใดๆ และค่อนข้างมีประโยชน์ที่จะละบริเวณเหล่านี้ในกราฟคาลิเบรชั่น

9. ระหว่างการหาพารามิเตอร์ของแบบจำลองที่เหมาะสม (ช่วงความถี่ที่เหมาะสม, การจัดการข้อมูลเบื้องต้น และจำนวนแฟคเตอร์ที่เหมาะสม) ผมพบว่าแบบจำลองจำนวนมากนำไปสู่ผลการทำนายที่คล้ายกัน แบบจำลองทั้งหมดนี้สามารถนำไปใช้กับตัวอย่างที่ไม่ทราบค่าได้เท่ากันหรือไม่
ไม่ ในกรณีส่วนใหญ่ยังใช้ไม่ได้ นี้คือกรณีเฉพาะถ้าปริมาณตัวอย่างจำนวนมากถูกเก็บข้อมูลและวัดในช่วงเวลานาน เพียงแต่วิธีนี้เท่านั้นที่จะทำให้มั่นใจว่าความแปรปรวนโดยธรรมชาติอยู่ในชุดตัวอย่าง ในความเป็นจริงสามารถวัดตัวอย่างในจำนวนจำกัดและในระยะเวลาที่สั้น ในที่นี้ ความน่าเชื่อถือของวิธีการ (แบบจำลอง)ควรถูกทดสอบเป็นบางครั้งโดยการวัดตัวอย่างชุดพิสูจน์ใหม่และควรมีการแลกเปลี่ยนถ้าจำเป็นโดยวิธีที่ดีกว่า (และ/หรือ ชุดพารามิเตอร์ที่ดีขึ้น) จากประสบการณ์แสดงว่าแบบจำลองหรือวิธีการต่างๆซึ่งแสดงผลการพิสูจน์ที่ดีพอๆกันในระหว่างการประเมิน (เช่น ค่า RMSEP/RMSECV และ ค่า R²ดีพอๆกัน) สามารถมีความแม่นยำที่แตกต่างกันอย่างมากในความเป็นจริง
ซึ่งจะแสดงโดย ตัวอย่างของโลกความเป็นจริง (Real-world example) สำหรับการวัดความสม่ำเสมอขององค์ประกอบ “content uniformity” ซึ่งบริษัทเภสัชกรรมต้องการติดตั้งเครื่อง NIR สเปกโตรมิเตอร์ซึ่งทำการวัดส่วนผสมสำคัญในเม็ดยา เพื่อให้แน่ใจว่าชุดข้อมูลที่สร้างมีความเป็นไปได้ จะเก็บตัวอย่างจากหลายแบช (Batches) โดยมีค่าอ้างอิงซึ่งครอบคลุมความช่วงเข้มข้นเท่ากันทั้งหมด ดังนั้นตัวอย่างมากกว่า 40 ตัวอย่าง ถูกวัดและนักพัฒนาวิธีการถูกทำให้มั่นใจว่า (มากกว่าหรือน้อยกว่า) ความแปรปรวนที่เกี่ยวข้องทั้งหมดจากกระบวนการผลิตได้ถูกรวมเข้าในวิธีเคโมเมตริกของเขา รูปที่ A.1 แสดงผลของการพิสูจน์: มีแบบจำลองที่แตกต่างกันจำนวนมากมีผลการพิสูจน์ใกล้เคียงกัน (RMSEP ประมาณ “1”) โดยเบื้องต้นแบบจำลองเหล่านี้ดูเหมือนจะดีเท่ากัน แต่การตรวจสอบว่าแบบจำลองเหล่านี้มีความครอบคลุม (Robust) อย่างไร จำเป็นต้องใช้ตัวอย่างชุดทดสอบอิสระจากแบชต่อๆ ไปแล้ววิเคราะห์

รูปที่ A.1 ตัวอย่างของข้อผิดพลาดการทำนายของแบบจำลองหลาย chemometric ในระหว่างการพัฒนาและวิธีการโดยใช้ชุดตัวอย่างที่ต่างหาก
ผลที่ได้พล็อตในรูปที่A.1 ตอนนี้รูปแบบที่แตกต่างกันแสดงความแตกต่างอย่างมากในการทำงานของพวกเขา แบบที่ 1 ให้ค่า RMSEP เทียบเท่ากับผลการตรวจสอบ รูปแบบที่10จะอยู่ที่ประมาณหนึ่งลำดับความสำคัญ (!) ที่เลวร้ายยิ่ง แม้ว่าเป็นจำนวนที่เพียงกลุ่มตัวอย่างและสำหรับกระบวนการที่มีการใช้การตั้งค่าการสอบเทียบแบบนี้จึงมีความไวต่อความแตกต่างเล็ก ๆ น้อย ๆ ที่เกิดขึ้นในการทดสอบชุดที่แยกต่างหากที่จะให้ผลที่น่ากลัวโดยสิ้นเชิง ในทางตรงกันข้ามรูปแบบที่ 1 มีประสิทธิภาพ – โดยใช้การสอบเทียบสเปกตรัมเดียวกันและค่าอ้างอิงจากรูปแบบที่ 10
- เพียงเนื่องจากการตั้งค่าที่ดีกว่า
ตัวอย่างนี้แสดงวิธีการที่สำคัญก็คือการตรวจสอบความมั่นคงรูปแบบอย่างต่อเนื่อง เพียงดูที่ R2 และค่า RMSEPการพัฒนาวิธีการที่ไม่เพียงพอ โดยเฉพาะอย่างยิ่งถ้ารูปแบบถูกเลือกสุ่มสี่สุ่มห้าซึ่งทำให้การคาดการณ์ต่ำที่สุดเกิดข้อผิดพลาดในระหว่างการตรวจสอบเป็นประจำ สามารถเห็นได้จากในรูปที่ A.1 แสดงว่ารูปแบบ 9 ให้ RMSEP ต่ำสุดสำหรับการตรวจสอบ แต่รุ่นนี้ไม่เสถียรอย่างมากในการให้ผลลัพธ์ที่ดีกว่าจะยอมรับได้ของ RMSEP

สำหรับชุดตัวอย่างที่แยกต่างหาก รูปแบบที่ 9 ควรจะเลือกในกรณีที่ไม่มี
บ่อยครั้งที่มันแสดงให้เห็นว่าพารามิเตอร์ที่เหมาะสมสำหรับรูปแบบที่มีประสิทธิภาพจะไม่สามารถได้รับการยอมรับแบบนิรนัยตั้งแต่ในระหว่างการเพิ่มประสิทธิภาพของวิธีการที่มีอิทธิพลต่อการระเบิดในอนาคตทั้งหมดจะไม่เป็นที่รู้จัก นอกจากนี้การวิเคราะห์มาตรการที่เป็นไปได้ (เช่นการคำนวณอนุพันธ์ค่าชดเชยจากกองพื้นฐาน) มักไม่ค่อยนำไปสู่การพัฒนารูปแบบที่เสถียรที่สุด ได้มีการแสดงความคิดเห็นซึ่งความคิดเห็นนี้เท่านั้นที่สามารถทำได้โดยการตรวจสอบเพิ่มเติมจากการสอบเทียบจากเวลา อย่างไรก็ตามชุดตัวอย่างมีขนาดใหญ่พอซึ่งสะท้อนให้เห็นถึงลักษณะของระบบ representatively เป็นการรับประกันการประมาณค่าที่แน่นอนของการวิเคราะห์ข้อผิดพลาดในระหว่างการเพิ่มประสิทธิภาพของวิธีการ

10. จะแน่ใจไอย่างไรว่าผลดีสำหรับการตรวจสอบจะนำไปสู่ผลลัพธ์ที่ดีตามที่มีการวิเคราะห์ของกลุ่มตัวอย่างที่ไม่รู้จัก ?
นี่เป็นเพียงกรณีที่จำนวนของกลุ่มตัวอย่างที่อยู่ในชุดการสอบเทียบซึ่งมีขนาดใหญ่พอ (ดูด้านบน)

11. โดยทั่วไปจะเลือกรุ่นที่มีระดับต่ำดีกว่าได้อย่างไร ?
ปกติรุ่นที่มีระดับต่ำกว่าจะดูจากหลักการคือ: ระดับน้อยจะได้รับการแต่งตั้งที่มีเสถียรภาพมากขึ้นคือการสอบเทียบ อย่างไรก็ตามมีตัวอย่างที่แสดงให้เห็นว่ารูปแบบนั้นสามารถจะรองลงมาจากระดับที่สูงกว่า ดังกล่าวก่อนหน้านี้: สำหรับการจำกัดจำนวนของกลุ่มตัวอย่างทั้งหมดที่ไม่ระเบิดที่เป็นไปได้ที่เป็นที่รู้จักกันยังไม่มีข้อสรุปที่ชัดเจนที่สามารถทำเกี่ยวกับวิธีที่ดีที่สุดที่เป็นไปได้ ซึ่งมันไม่สามารถตัดออกได้ที่ว่าเมื่อมีวิธีการตรวจสอบกับกลุ่มตัวอย่างใหม่อีกครั้งในขั้นตอนภายหลัง ซึ่งเป็นวิธีการที่แตกต่างกันกับพารามิเตอร์ที่แตกต่างกัน และบางทีอาจจะแสดงระดับขั้นที่สูงขึ้นโดยอาจจะดีกว่า

12. พารามิเตอร์รบกวนที่จะเป็นประโยชน์ในการป้อนค่าหรืออุณหภูมิของตัวอย่างในซอฟแวร์เมื่อเทียบระบบเพื่อให้แน่ใจว่าได้จะถูกนำเข้าบัญชี?
ส่วนของแพคเกจซอฟต์แวร์ chemometric ขั้นตอนวิธี PLS มักจะนำไปสู่ผลลัพธ์ที่ดี ด้วยวิธีการนี้จะมีเพียงค่าส่วนประกอบของสารจะถูกนำเข้าบัญชีและมีความสัมพันธ์กับคุณสมบัติสเปกตรัมที่สอดคล้องกัน สิ่งอื่นใดที่จะได้รับการตรวจพบว่าเป็นสิ่งรบกวน นั่นคือข้อมูลความเข้มข้น จะถือว่าเป็นเวกเตอร์และค่าองค์ประกอบอื่น ๆ หรือค่าอุณหภูมิที่ไม่นำไปสู่การเปลี่ยนแปลงของผลค่าเพิ่มเติมจะไม่นำมาพิจารณาในระหว่างการวิเคราะห์ หากคุณต้องการที่จะวิเคราะห์ระบบองค์ประกอบหลายกับ PLS 1 มันถูกนำมาใช้อย่างต่อเนื่องไปยังทุกส่วนของการแคริเบชั่นการระบุอุณหภูมิตัวอย่างเพียงทำให้รู้สึกหากคุณต้องการที่จะคำนวณอุณหภูมิของตัวอย่างที่ไม่รู้จัก เช่นการใช้ spectrometer เป็นเครื่องวัดอุณหภูมิ

13. อะไรที่เป็นสิ่งรบกวน ? ฉันจะสามารถหลีกเลี่ยงหรือพิจารณาพวกเขาในรูปแบบ ?
การแคริเบชั่น PLS พยายามกำหนดโครงสร้างสเปกตรัม จากวิเคราะห์ค่าส่วนประกอบ (เช่นความเข้มข้น) การเปลี่ยนแปลงในสเปกตรัมมีความสัมพันธ์กับการเปลี่ยนแปลงในมูลค่าส่วนประกอบ ความสัมพันธ์นี้จะเลว ยิ่งถ้ามีการเปลี่ยนแปลงวิเคราะห์เฉพาะในสเปกตรัมทับซ้อนกับที่ไม่เฉพาะเจาะจง โครงสร้างเหล่านี้สามารถมีได้หลายประการ: การดูดกลืนโดยองค์ประกอบอื่น ๆ ของกลุ่มตัวอย่าง ผลกระทบ Straylight ของอนุภาคขนาดแตกต่างกันในการเปลี่ยนแปลงอุณหภูมิตัวอย่าง ฯลฯ เป็นที่ชัดเจนว่าโครงสร้างทั้งหมดที่ทับซ้อนวิเคราะห์สเปกตรัมให้การแคริเบชั่นยากขึ้น มีขนาดเล็กกว่าความเข้มข้นของสารที่เป็นโครงสร้างมากขึ้นจะทับซ้อนสัญญาณ เพราะฉะนั้นขีด จำกัด ของการตรวจจับของสาร ในการประยุกต์ใช้ที่เฉพาะเจาะจงมากขึ้น ขึ้นอยู่กับความแปรปรวนทางธรรมชาติของเมทริกซ์ในสัญาณรบกวนของสเปกตรัมจากการวัด วิธี spectroscopic เช่นเดียวกับตัวอย่างเช่น NIR สเปกโทรสโก เป็นปกติไม่เหมาะสำหรับการใช้งานการวิเคราะห์ติดตาม เหตุผลก็คือปัญหาที่เกิดขึ้นทั่วไปในการแยกความแตกต่างสัญญาณ ที่ต้องวิเคราะห์เฉพาะทางคณิตศาสตร์ ในที่นี้วิธี chromatographic (เช่น HPLC) มีประโยชน์เนื่องจากสามารถแยกองค์ประกอบต่างๆทางกายภาพและทำให้เห็นได้ชัดเจนขึ้น การรบกวนเหล่านี้โดยปกติแล้วไม่สามารถกำจัดได้ อย่างไรก็ดี โดยการเลือกวิธีเตรียมตัวอย่างที่ดีและโดยการกำหนดวิธีการที่ฉลาดจะช่วยให้การรบกวนลดลง ตัวอย่างเช่น ตัวอย่างเนื้อไม่สม่ำเสมอ: การบดหรือการใช้ integrating sphere ประกอบกับการหมุนตัวอย่าง
อุณหภูมิไม่แน่นอน: ใช้การวัดโดยควบคุมอุณหภูมิของคิวเวตและขวดไวอัล แสงรบกวนจากภายนอก: บังช่องการวัดเช่นคลุมด้วยผ้าดำหรือใช้เครื่องแบบ Fourier Transform (FT) การเกิดฟิล์มหรือการยึดตัวภายในตัวอย่าง (เช่นตัวอย่างอาหาร): วัดในแบบการส่องผ่าน มีการกระเจิงแสงอย่างรุนแรง (เช่น เม็ดยา): วัดในแบบการส่องผ่านโดยใช้ลำแสงส่องตรง เม็ดยาที่มีการเคลือบ: วัดในแบบการส่องผ่านโดยใช้ลำแสงส่องตรง การวัดผ่านบรรจุภัณฑ์ด้วยหัววัด แต่การจัดการทางคณิตศาสตร์กับสเปกตรัมดิบสามารถช่วยลดการรบกวนได้ ตัวอย่างเช่นวิธี MSC (Multiple Scattering Correction) มีประโยชน์ในการแก้ไขการกระเจิงแสง และวิธีทำอนุพันธ์ช่วยแก้ปัญหาการขยับขึ้นของสเปกตรัม (baseline drifts)

14. ตัวอย่างที่เป็นสารละลายในน้ำมีความไวอย่างมากต่ออุณหภูมิที่เปลี่ยนแปลง เราควรเก็บตัวอย่างจำนวนมากในช่วงอุณหภูมิที่กว้าง (เพื่อให้ได้แบบจำลองที่ครอบคลุม) หรือควรจะควบคุมอุณหภูมิของตัวอย่างให้คงที่ระหว่างการวิเคราะห์ (เพื่อหลีกเลี่ยงความแปรปรวนของอุณหภูมิ)
ทั้ง 2 วิธีเป็นไปได้ แต่โดยปกติจะใช้วิธีควบคุมอุณหภูมิซึ่งวิธีนี้ให้ผลที่ดีที่สุด

15. จำเป็นต้องมีการชดเชยผลกระทบของสิ่งแวดล้อมต่ออุปกรณ์ เมื่อไร
โดยปกติ อุปกรณ์นั้นจะเสถียรอยู่แล้ว อย่างน้อย 2-3 ชั่วโมง ถ้ามีการทำ (วัด) แบคกราวน์ (Background) เป็นระยะ ผลกระทบสิ่งแวดล้อมควรจะไม่มีปัญหา อย่างไรก็ตาม มันไม่ได้ใช้กับหลายการประยุกต์ใช้แบบ in-line สำหรับการวัดเหล่านี้ มักจะเป็นไปไม่ได้ที่จะทำแบคกราวน์ได้ง่าย เนื่องจากหัววัดติดตั้งอยู่ในสายการผลิตโดยตรง การเปลี่ยนแปลงอุณหภูมิและความชื้นในระยะยาวจะทำให้ผลการวัดเลวลงเป็นอย่างมาก (ดูรูปที่ 5.3) ในกรณีนี้สเปกโตรมิเตอร์ควรมีเครื่องตัดกระแสไฟฟ้าในช่องปรับอากาศ (air-conditioned cabinet) อิทธิพลของความชื้น สามารถกำจัดโดยใช้อุปกรณ์ห่อหุ้มที่มิดชิด ถ่ายเทอากาศใน สเปกโตรมิเตอร์โดยใช้ลมแห้ง หรือไม่ใช้แถบดูดซับคลื่นของน้ำระหว่างการคาลิเบรชั่น

16. ฉันจะรู้ว่าเป็นชุดข้อมูลคอลลิเนียร์ (Collinear data sets) ได้อย่างไร
ในทางคณิตศาสตร์ เวคเตอร์ 2 เวคเตอร์ Collinear กัน หากตัวใดตัวหนึ่งเป็นจำนวนเท่าของอีกตัวหนึ่ง ในทางเคมีวิเคราะห์ ข้อมูล 2 ชุด จะ Collinear กัน เมื่อค่าองค์ประกอบ 2 ชนิดหรือมากกว่า มีการเปลี่ยนไปในทางเดียวกัน (ดูรูปที่ 5.1) ในบริบทนี้ มันไม่จำเป็นว่าค่าขององค์ประกอบที่ต่างกันจะเปลี่ยนไปในทางเดียวกันหรือไม่ หรือว่าจะมีการเพิ่มหรือลดหรือไม่ ถ้าข้อมูลอ้างอิง มีจำนวน 2 องค์ประกอบ หรือมากกว่าซึ่งแสดง collinearrity ตัวอย่างเหล่านี้ไม่ควรจะใช้ในการทำคาลิเบรชั่น ซึ่งในกรณีนี้ ขั้นตอน PLS ไม่สามารถระบุโครงสร้างสเปกตรัมให้กับองค์ประกอบที่สอดคล้องที่ถูกต้องได้ (ข้อยกเว้น: ระบบที่ค่าองค์ประกอบเป็น Collinear เสมอ ตัวอย่างเช่น ระบบ 2 องค์ประกอบ) ชุดข้อมูลคอลลิเนียร์ตรวจสอบได้ไม่ยากโดยการพล๊อตองค์ประกอบต่างๆในกราฟ x/y (ดูรูปที่ A.2)
ในทางพีชคณิตแบบเวคเตอร์ไม่มีการศึกษาเกี่ยวกับ collinearity แต่อย่างไรก็ตาม ในบริบทของการคาลิเบรชั่นแบบ PLS มักจะพูดถึง collinearity ที่มากหรือน้อยขึ้นอยู่กับว่าข้อมูลอ้างอิงนั้นมีความเกี่ยวข้องกันใกล้ชิดหรือไม่

รูป A.2 การเปรียบเทียบค่าองค์ประกอบที่แตกต่างกัน a) collinear, b) slightly collinear, c) non-collinear 17 ชุดข้อมูลแบบ collinear ไม่สามารถใช้สำหรับการสร้างสมการคาลิเบรชั่นได้เลย ใช่หรือไม่ ใช่ ถ้า collinearity เกิดจากความประมาทในการเลือกค่าอ้างอิง (เช่น ถ้าเป็นผลของชุดเจือจาง) และถ้าไม่มีเหตุผลตามธรรมชาติ (ความเป็นจริง)

17. ชุดข้อมูลแบบ Collinear ไม่มีประโยชน์ในการคาลิเบรชั่นเลยหรือ
ใช่ ถ้า Collinearity เกิดจากการเลือกค่าอ้างอิง (reference) อย่างไม่ระมัดระวัง (เช่น เป็นผลจากชุดการเจือจาง) และถ้าไม่ใช่เหตุผลที่เป็นธรรมชาติ อย่างไรก็ตามสมบัติของระบบหลายๆสมบัติมีความสัมพันธ์โดยธรรมชาติ จึงทำให้ได้ค่าอ้างอิงเป็น Collinear ในกรณีนี้ค่าองค์ประกอบต่างๆมีความสัมพันธ์ซึ่งกันและกันเสมอ จึงไม่จำเป็นต้องจำแนกความแตกต่าง จากค่าองค์ประกอบหนึ่งค่าก็สามารถหาค่าองค์ประกอบอื่นๆ (ซึ่งมีความสัมพันธ์ Collinear กับองค์ประกอบที่เป็นปัญหา) ได้ ดังนั้นในกรณีนี้ชุดข้อมูลแบบ Collinear สามารถนำมาใช้คาลิเบรชั่นได้โดยไม่เกิดปัญหา
ตัวอย่าง วิธีการเชิงสเปกโทรสโกปีที่ใช้ในการวิเคราะห์ค่าเลขออกเทน (octane number) ครั้งแรกที่คิดมันดูแปลกประหลาดที่การวิเคราะห์ทาง NIR สามารถทำนายพฤติกรรมการน๊อค (knock behavior) ของเครื่องยนต์เบนซินที่ใช้ส่วนผสมเชื้อเพลิงที่ต่างกัน อย่างไรก็ตาม ไม่มีข้อสงสัยเกี่ยวกับความเคร่งครัดของการคาลิเบรชั่น พฤติกรรมการน๊อคมีความสัมพันธ์โดยตรง (แบบ Collinear) กับองค์ประกอบชนิดหนึ่งๆ เพราะองค์ประกอบเหล่านี้สามารถวัดได้โดยใช้วิธีการเชิงสเปกโทรสโกปี จากค่าที่ได้ทำให้สามารถหาค่าเลขออกเทนได้โดยตรง

18. ถ้ากำลังหาองค์ประกอบที่มีความเข้มข้นต่ำในเมทริกส์ที่ซับซ้อน มันเหมาะสมหรือไม่ที่จะใช้เมทริกส์นี้เป็น background measurement เพื่อที่จะสกัดองค์ประกอบนี้โดยทางคณิตศาสตร์ เพื่อให้มองเห็นได้ชัดเจนขึ้น
วิธีการนี้ยังไม่มีการแนะนำให้ใช้ ทันทีที่เมทริกส์นี้แสดงให้เห็นการเปลี่ยนแปลงที่น้อยที่สุดในระหว่างการวิเคราะห์ (สิ่งซึ่งหลีกเลี่ยงไม่ได้) ซึ่งมีการรบกวนทางโครงสร้างเกิดขึ้นในเส้นสเปกตรัม (ดูรูปที่ 5.5) การรบกวนนี้มีจะส่งผลให้ผลความน่าจะเป็นอย่างมีนัยสำคัญที่ผลการวิเคราะห์ไม่ดีราวกับว่าใช้อากาศเป็น background นอกจากนี้วิธีการ PLS สามารถที่จะชดเชยเมทริกส์ที่รบกวนที่ส่งผลต่อแบบจำลองซึ่งการรบกวนนี้เกิดในระหว่างการเก็บสเปกตรัม (การสแกนตัวอย่าง) ดังนั้นจึงไม่จำเป็นต้องกำจัดออกไป

19. เป็นไปได้ไหมที่จะทำให้ผลการวิเคราะห์ดีขึ้นโดยใช้การวัดซ้ำหลายครั้งและหาสเปกตรัมเฉลี่ยภายหลัง
ได้ วิธีนี้แนะนำสำหรับตัวอย่างที่มีเนื้อไม่สม่ำเสมอ

20. สามารถประยุกต์วิธีนี้กับการสแกนสเปกตรัมสำหรับชุดคาลิเบรชั่น นั่นคือ หลังจากสแกนหลายซ้ำแล้วหาสเปกตรัมเฉลี่ย แล้วใช้ในการคาลิเบรชั่นได้หรือไม่
ได้ แต่ผลสำหรับการพิสูจน์ (RMSEP หรือ RMSECV) เป็นเพียงประมาณที่หยาบสำหรับการสแกนหลายซ้ำที่ สอดคล้องในอนาคต การสแกนครั้งหนึ่งๆจะแสดงความแปรปรวนของค่าที่มากกว่า นอกจากนี้ เมื่อนำมา พิจารณา วิธีนี้อาจไม่ปรับปรุง PLS-regression หีดีขึ้น (นั่นคือ b coefficient) สำหรับกรณีนี้ ข้อมูลทั่วไปไม่สามารถให้ได้เพราะว่าชุดสเปกตรัมของชุดคาลิเบรชั่นถูกเปลี่ยน (เฉลี่ย) ซึ่งทำให้เกิดความต่างของ พารามิเตอร์ในการสร้างแบบจำลอง (ความต่างของช่วงความถี่, ความต่างของวิธีการจัดการสเปกตรัมเบื้องต้น และจำนวนแฟคเตอร์) ผลที่ตามมาคือผลของการพิสูจน์ไม่สามารถนำไปเปรียบเทียบกันได้
อย่างไรก็ตามการวิเคราะห์ตัวอย่างที่มีเนื้อไม่สม่ำเสมออย่างมากจะเป็นไปได้ถ้าทำสแกนหลายซ้ำและเฉลี่ยภายหลัง ในกรณีนี้สเปกตรัมของชุดคาลิเบรชั่นควรได้จากสภาวะที่คล้ายกัน นั่นคือการคาลิเบรชั่นควรทำบนพื้นฐานของการเฉลี่ยสเปกตรัม

21. สามารถแก้ไข ค่านอกกลุ่ม (outlier) ในชุดข้อมูลคาลิเบรชั่นบนพื้นฐานของกราฟคาลิเบรชั่น (calibration curve) ที่มีอยู่แล้ว นั่นคือ ในการคาลิเบรชั่น จะใช้ค่าอ้างอิงในปัจจุบันแทนค่าที่คำนวณจากกราฟคาลิเบรชั่นได้หรือไม่
ฉันได้พูดถึงคำถามนี้ไปแล้วหลายครั้งในลักษณะที่โต้แย้ง การสนับสนุนได้โต้แย้งดังนี้: ปกติคุณภาพของการคาลิเบรชั่นส่วนใหญ่ถูกกำหนดโดยคุณภาพของค่าอ้างอิง
การวัดแบบสเปกโตสคอปิก (Spectroscopic measurement) ทั่วไปแล้วมีความน่าเชื่อถือมากกว่าค่าอ้างอิงที่ได้จากห้องปฏิบัติการ ดังนั้นเหมือนเป็นการแนะนำไปในตัวว่า คุณสามารถเชื่อมั่นการวัดแบบสเปกโตสคอปิกและสามารถใช้มันแทนค่าอ้างอิงจากห้องปฏิบัติการในการทำไปคำนวณโดย PLS regression ซึ่งถ้าคุณนำเอาแนวคิดนี้ไปปฏิบัติจนจบ นั้นหมายความว่าคุณสามารถค่อยๆปรับปรุงการสอบเทียบค่า (Calibration) ของคุณเองได้โดยการแก้ไขค่าที่แย่ที่สุดในตาละช่วง เช่นเดียวกับที่อธิบายไว้ข้างต้นและอีกครั้งในการสอบเทียบกับค่าอื่นที่ถูกปรับปรุงมาแล้วที่ตั้งไว้ตามลำดับอย่างเป็นขั้นเป็นตอนในการปรับปรุงการสอบเปรียบเทียบฟังกชั่นอย่างต่อเนื่อง
ผู้เขียนเองได้มีการพิจารณาว่าขั้นตอนดังกล่าวไม่เป็นที่น่าเชื่อถือ ค่าอ้างอิงใหม่ที่ได้นั้นไม่ได้รวมถึงข้อมูลเพิ่มเติมอื่นๆที่เกี่ยวข้องกับการสอบเทียบเลย เพราะค่าที่ได้จากการแก้ไขนั้นจะถูกออกจากกราฟมาตรฐานอยู่ดี (Calibration curve) ซึ้งรูปแบบของการสอบเทียบนั้น (Calibration model) ไม่สามารถปรับปรุงให้ดีขึ้นได้บนพื้นฐานของค่าอ้างอิงที่เกิดจากจากรูปแบบการสอบเทียบตัวเอง ในขั้นตอนนี้โดยเฉพาะการสร้างจุดเพิ่มเติมที่ปลอมแปลงขึ้นอย่างอุดมคติบนกราฟมาตรฐาน จะให้ความรู้สึกที่สมบูรณ์แบบกับข้อมูลที่มีอยู่ แต่ข้อมูล ‘อุดมคติ’ เหล่านี้เป็นข้อมูลหลอกลวงและนำไปสู่ความเข้าใจผิดในการสร้างรูปแบบการสอบเทียบที่ดี (กับข้อมูลจำนวนน้อยของการวิเคราะห์ที่ผิดพลาด) แต่คุณภาพของการสอบเทียบที่แท้จริงนั้นยังคงหลบซ่อนอยู่

22. จะมีความผิดพลาดใดเกิดขึ้นใช่หรือไม่ ถ้าเอา outliers ออกจากชุดข้อมูลสอบเทียบทันที?
ใช่ มันเห็นผลได้ไม่ชัดเจนว่า outlier จากการวัดที่ผิดพลาด หรือรูปแบบของ PLS ให้ผลความน่าเชื่อถือต่ำ อย่างไรก็ดี outlier เป็นสิ่งสำคัญ โดยเฉพาอย่างยิ่งกลุ่มตัวอย่างที่แสดงถึงการวัดที่ผิดพลาดจะเหมาะอย่างยิ่งกับการทดสอบความทนทานของรูปแบบทางเคมี (Chemometric model) จะพบว่ารูปแบบที่ต่างกันไปในความไวต่อสเปกตรัมนั้นใช้งานไม่ได้จริงในลักษณะนี้ สำหรับการวิเคราะห์ในอนาคต มันจะแนะนำได้ว่ารูปแบบดังกล่าวนั้นจะสามารถวิเคราะห์สเปกตรัมที่ลำบากนั้นได้อย่างน่าเชื่อถือ
เพียงแต่สเปกตรัมที่เผยออกมาจากวิธีการอ้างอิงอิสระนั้น (Independent reference method) เป็นผลมาจากการวัดที่ผิดพลาด
อย่างไรก็ดีถ้าวิธีการอ้างอิงชี้ให้เห็นว่าตัวอย่างที่เป็นตัวอย่างผิดปกติ (outlier) เป็นผลมาจากการวัดที่ถูกต้อง ตัวอย่างนั้นจะมีความสำคัญสำหรับการสร้างแบบจำลอง เนื่องจากความจริงที่ว่าในทางปฏิบัติตัวอย่างที่เกิดขึ้นทั้งหมดต้องถูกวิเคราะห์ ดังนั้นตัวอย่างเหล่านี้ควรต้องรวมอยู่ในแบบจำลองและมันควรถูกวิเคราะห์ความถูกต้องในวิธีการพิสูจน์ (Validation)สุดท้ายโดยเฉพาะอย่างยิ่งตัวอย่างเหล่านั้นมีความสำคัญในการหาแบบจำลองที่ดี

23. หลังจากได้ตัดตัวอย่างที่ผิดปกติ (outlier) ฉันต้องทำการพิสูจน์ (Validation) เพื่อที่จะหาพารามิเตอร์ของแบบจำลองที่ดีหรือไม่
ใช่ เพราะว่าตัวอย่างผิดปกติมีผลกระทบที่ไม่ต้องการต่อแบบจำลองและมันนำไปสู่การเพิ่มขึ้นของค่าผิดพลาด(RMSEP และ RMSECV) ที่ไม่เป็นธรรมชาติ

24. ในการศึกษาและบทความวิจัยหลายเรื่อง การวิเคราะห์ค่าผิดพลาดได้จากการพิสูจน์โดยใช้สเปกตรัมที่ได้ถูกนำมาสร้างแบบจำลองซึ่งก็คือ สเปกตรัมในชุดสร้างแบบจำลองและในชุดพิสูจน์เหมือนกัน ในกรณีนี้การรายงานผลเหล่านั้นแสดงค่า RMSEE หรือ SEE (RMSEC หรือ SEC) แทนที่จะเป็น RMSECV (หรือ SECV) หรือ RMSEP (SEP) ขั้นตอนเหล่านี้เชื่อถือได้หรือไม่
ถ้าชุดคาลิเบรชั่นและชุดพิสูจน์รวมสเปกตรัมที่เหมือนกันมันเป็นไปไม่ได้ที่จะระบุค่าความผิดพลาดที่เชื่อถือได้ในการนำไปประยุกต์ใช้ในความเป็นจริง แบบจำลองเหล่านี้นำไปสู่การ “ความแม่นยำที่เกินความจริง” (overfitting) ซึ่งจะเพิ่มขึ้นเมื่อจำนวนแฟกเตอร์เพิ่มขึ้น เหตุผลก็คือสเปกตรัมที่ใช้พิสูจน์แบบจำลองได้ถูกรวมอยู่ในชุดสร้างแบบจำลอง ยิ่งจำนวนแฟกเตอร์มากขึ้นมันจะยิ่งง่ายที่จะวัดค่าได้ใหม่ และทำให้ดูเหมือนว่าความผิดพลาดของการวิเคราะห์น้อยลง ซึ่งถ้ามีความแม่นยำที่เกินความจริงที่เหมาะสมท่านจะสามารถวัดค่าได้ใกล้เคียงความจริงตามที่ท่านต้องการ (ดูรูปที่ 6.10) ค่า RMSEE หรือ RMSEC จะสามารถเทียบได้กับ RMSECV หรือ RMSEP เมื่อใช้แฟกเตอร์ที่เหมาะสมเพื่อที่จะทำให้ความแตกต่างระหว่างแบบจำลองจริงกับแบบจำลองในอุดมคติเป็นไปได้ การคำนวณแบบจำลองที่ดีที่สุดโดยใช้พื้นฐานของค่า RMSEE หรือ RMSEC หรือ การประมาณความผิดพลาดของการวิเคราะห์ที่เป็นจริงที่ถูกคาดหวังเชื่อถือไม่ได้เลย

25. ฉันต้องใช้สเปกตรัมการดูดกลืนแสงเฉพาะสำหรับการแคริเบรชั่นหรือฉันสามารถใช้สเปกตรัม interferograms ช่องเดียวหรืออื่นๆ
โดยทั่วไปโครงสร้างทั้งหมดสามารถสอบเทียบแต่สเปกตรัมการดูดกลืนแสงมีความได้เปรียบในการแสดงความสัมพันธ์เชิงเส้นระหว่างการดูดกลืนแสงและความเข้มข้นเนื่องจากกฎเบียร์ Lambert ดังกล่าวมีความสัมพันธ์เชิงเส้นค่อนข้างมีประโยชน์ในการคำนวณที่แม่นยำรูปแบบที่มีความมั่นคงสูง (แถวต่ำ)

26. การแคริเบชั่นมันทำให้รู้สึกได้ถึงสเปกตรัมที่จะมีความละเอียดสูงสุดที่เป็นไปได้ จากสเปกโตรมิเตอร์ของฉัน (เพื่อวัดข้อมูลส่วนใหญ่ทางกายภาพ)
หมายเลข ระบบส่วนใหญ่มี 'ทางกายภาพต่างๆมากกว่าการพิจารณา' คือคลื่นความถี่ที่มีจุดข้อมูลมากกว่าที่จะจำเป็นสำหรับการประเมินผล การใช้งานมากที่สุดมีความละเอียดสูงไม่ได้หมายความว่าข้อได้เปรียบเพิ่มขึ้น ในทางตรงกันข้าม การวัดจะใช้เวลาโดยไม่จำเป็นอีกต่อไปหรือการเพิ่มขึ้นของสเปคตรัมรบกวน สำหรับการใช้งานส่วนใหญ่ผู้ผลิตของ e-I spectrometers FT แนะนำความละเอียด 8 cm. ถึง 16 cm.^-1 นี่คือการประนีประนอมที่ดีระหว่างการวัดเวลา (ประมาณ 10 วินาที.) และได้รับแสง เครื่องมือกระจายตัวทำงานได้แม้จะมีความละเอียดที่ต่ำกว่ามากขึ้น (แคลิฟอร์เนีย 25 E 100 cm. ) ขึ้นอยู่กับตำแหน่งที่สังเกตได้ในสเปกตรัม แต่สำหรับการใช้งานส่วนใหญ่ก็จะไม่ลำเอียง เพียงไม่กี่โปรแกรมต้องมีความละเอียดสูง ตัวอย่างคือการกำหนดความเข้มข้นของส่วนผสมที่ใช้งานในเม็ดยา ยามากที่สุดในความเข้มข้นของสารออกฤทธิ์คือต่ำเพื่อให้ได้ว่าแท้จริงความละเอียดสูงจะต้องได้รับการวิเคราะห์ผลลัพธ์ที่เป็นประโยชน์ .

รูปที่ A.3 สเปกตรัมของไอน้ำที่ค่าความละเอียด 2 cm^-1 และ 25 cm^-1
การปรับตัวนี้สามารถหลีกเลี่ยงได้ถ้าคุณใช้เครื่อง FT-spectrometer ที่มีความถูกต้องในการวัดดีกว่า ประมาณ 20 เท่า (0.1 cm^-1) ดังนั้น ค่าความละเอียดสูงของเครื่อง spectrometer ไม่ได้ชี้ชัดโดยตรงว่าเป็นความมีประโยชน์ของเครื่อง spectrometer ในระหว่างการทำงานปกติของเครื่อง แม้ว่าการประยุกต์ใช้ส่วนใหญ่ไม่ต้องการความละเอียดสูง

28. ฉันเพียงแค่ต้องการวัดความชื้นในวัสดุทดสอบของฉันโดยใช้ NIR มันเป็นการประยุกต์ที่ง่าย นอกจากนี้ สเปกตรัมของน้ำแสดงแถบการดูดซับคลื่น (พีค) ที่กว้าง ซึ่งอย่างน้อยในการประยุกต์ใช้นี้ เครื่อง spectrometer ที่มีความละเอียดสูงจึงไม่มีความจำเป็น
เป็นข้อผิดพลาดที่ผิดบ่อยที่สุด ที่ว่าการประยุกต์กับสารที่ถูกวิเคราะห์มีพีคกว้าง (เช่น การตรวจสอบหาปริมาณความชื้น) ต้องการเพียงเครื่องมือที่มีสมรรถนะความละเอียดต่ำ อย่างที่ได้เคยอธิบายไปแล้วในคำถามข้อที่ 26 และ 27 ว่า ความละเอียดของเครื่องกำหนดความถูกต้องในการวัดที่จำเป็น แต่ไม่ใช่เกี่ยวกับองค์ประกอบที่มีพีคแหลมหรือพีคกว้างที่จะวิเคราะห์ อีกแง่หนึ่งก็คือ แม้กระทั่งการประยุกต์กับโครงสร้างของสารที่ถูกวิเคราะห์ที่มีพีคแหลม หรือปัญหาการวิเคราะห์ที่ซับซ้อนมากขึ้นสามารถแก้ไขได้ด้วยความละเอียดที่ต่ำกว่า ซึ่งจะทำให้คุณเต็มใจที่จะยอมรับการปรับลดเพื่อความเสถียรของแบบจำลองในระยะยาวหรือการถ่ายโอนของแบบจำลอง นี่เป็นจุดที่สำคัญ

29. ฉันควรจะใช้วิธีพิสูจน์แบบไขว้แทนการพิสูจน์แบบชุดทดสอบเพราะการพิสูจน์แบบไขว้ใช้จำนวนสเปกตรัมที่น้อยกว่า
ถ้ามีจำนวนตัวอย่าง (20-50 ตัวอย่าง) คุณควรใช้วิธีพิสูจน์แบบไขว้ อย่างไรก็ดีคุณควรพยายามให้ได้ตัวอย่างจำนวนมากเพื่อที่จะตรวจสอบความเสถียรของแบบจำลองต่างๆโดยการใช้การพิสูจน์แบบไขว้ (ดูบทที่ 5H)

30. ฉันจะหาจุดเหมาะสมของเส้นทางแสงผ่านสำหรับการวัด NIR ได้อย่างไร
ในกรณีทั่วไปเส้นทางแสงผ่านขนาด 1 mm (บางที 2 mm) เหมาะสำหรับการวัดของเหลวแบบส่องผ่าน เส้นทางแสงผ่านอาจถูกพิจารณาอย่างอุดมคติถ้าสเปกตรัมแสดงค่าการดูดซับคลื่นระหว่าง 0.7-1.0 ในช่วงการคาลิเบรชั่น และเป็นสิ่งที่ยอมรับได้ถ้ามีพีคอื่นๆอยู่นอกช่วงคาลิเบรชั่นซึ่งแสดงการดูดซับคลื่นทั้งหมด พีคเหล่านี้ไม่มีผลต่อการคาลิเบรชั่น ในบริบทนี้ค่าการดูดซับคลื่นที่สูงกว่า 2.0 (2.5 ในกรณีของ FT spectrometers) ไม่ควรนำมาใช้ (เพราะว่าโดยทั่วไปมันได้รวมสิ่งรบกวนสเปกตรัมเป็นส่วนใหญ่)
ในบางครั้งการประยุกต์ใช้ต้องการเส้นทางแสงผ่านที่กว้าง ตัวอย่างเช่น การวิเคราะห์ตัวอย่างที่มีเนื้อไม่สม่ำเสมอ (เพื่อครอบคลุมหน้าตัดของตัวอย่างที่เป็นตัวแทนมากขึ้น) ในกรณีนี้คุณสามารถใช้ โอเวอร์โทน (overtones) ที่สูงขึ้นสำหรับการวิเคราะห์โดยใช้เส้นทางแสงผ่าน 10 mm หรือมากกว่า เช่นในกรณีของตัวอย่างอาหาร โดยทั่วไปผลิตภัณฑ์นมหรือเนื้อที่ถูกวัดด้วย NIR จะใช้เส้นทางแสงผ่านที่กว้าง แม้ว่าคุณกำลังวิเคราะห์สารที่มีความเข้มข้นต่ำมากคุณควรใช้เส้นทางแสงผ่านที่กว้างซึ่งการทำเช่นนั้นแทนการดูดซับคลื่นของตัวอย่างจะถูกทำให้แรงขึ้นและสัญญาณขององค์ประกอบหลัก (ที่ไม่สนใจ) จะหายไปเนื่องจากการดูดซับทั้งหมด ถ้าการวิเคราะห์องค์ประกอบหลักเป็นสิ่งที่สนใจมันมักจะเป็นไปได้ที่จะหาช่วงความยาวคลื่นที่เหมาะสมนอกช่วงที่มีการดูดซับทั้งหมด
ยกตัวอย่างเช่น พีคที่มีค่าต่ำหรือบ่าของแถบการดูดซับคลื่นที่เป็นพีคที่สูงกว่าที่มีการดูดซับทั้งหมดอยู่ด้านบน ดังนั้นองค์ประกอบหลักและองค์ประกอบรองสามารถถูกวิเคราะห์พร้อมกันโดยใช้เส้นทางแสงผ่านที่กว้างขึ้น (นั่นคือ คุณไม่จำเป็นต้องวัดซ้ำเพื่อวิเคราะห์องค์ประกอบหลักโดยใช้เส้นทางแสงผ่านที่แคบลง)

31. ฉันจะหาขนาดจุดการวัดที่เหมาะสม ตัวอย่างเช่น การวัดดริฟท์ (DRIFT) ได้อย่างไร
ขนาดจุดการวัดที่จำเป็นขึ้นกับขนาดของอนุภาคและความไม่สม่ำเสมอของตัวอย่าง ในที่สุดจุดการวัดต้องครอบคลุมหน้าตัดของตัวอย่างที่เป็นตัวแทน เส้นผ่านศูนย์กลางของจุดการวัดควรจะมีค่าหลายเซนติเมตร (ตัวอย่างเช่น ในโรงงานอุตสาหกรรมอาหารและอาหารสัตว์ โรงงานอุตสาหกรรมโพลิเมอร์ เป็นต้น) การใช้อุปกรณ์หมุนตัวอย่างจะช่วยปรับปรุงผลที่ได้เนื่องจากมีการหมุนตัวอย่างผ่านจุดวัดแสงเพิ่มขึ้น

32. มีการแนะนำให้หาช่วงความถี่ของสเปกตรัมที่เหมาะสมสำหรับการคาลิเบรชั่นโดยมีพื้นฐานจากตารางสเปกตรัม (ดูตารางที่ 5.3 หรือรูป 5.7) หรือโดยความช่วยเหลือของสเปกตรัมของสารบริสุทธิ์ (โดยการวัดที่ตำแหน่งที่แน่นอนของแถบการดูดซับคลื่นหลักและใส่ค่าเหล่านี้ลงในซอฟท์แวร์เคโมเมตริก) หรือไม่
ขั้นตอนนี้ไม่แนะนำเพราะตารางสเปกตรัมไม่เปิดเผยว่าแถบการดูดซับคลื่นที่ถูกทับซ้อนโดยสิ่งรบกวนในระดับใด ผู้รับผิดชอบในการสร้างแบบจำลองควรใช้เวลาในการสร้างชุดตัวอย่างคาลิเบรชั่นที่เป็นตัวแทนและตรวจสอบความครอบคลุมของแบบจำลองเป็นระยะ

33. มีการแนะนำหรือไม่ว่าสำหรับการวิเคราะห์ของผสมที่มีองค์ประกอบหลายอย่างควรเพิ่มสเปกตรัมของสารบริสุทธิ์ลงไปในชุดคาลิเบรชั่นเพราะในสเปกตรัมเหล่านี้พีคจะไม่ซ้อนทับกับสารอื่น
ไม่อย่างแน่นอน เพราะว่ามีความเสี่ยงในการเพิ่มตัวอย่างลงไปในชุดข้อมูลซึ่งอยู่นอกเหนือช่วงคาลิเบรชั่นที่เกี่ยวข้องแต่เป็นสิ่งซึ่งจะถูกวิเคราะห์ด้วยในครั้งนี้ มันชัดเจนว่าวิธีนี้จะทำให้การคาลิเบรชั่นยิ่งเลวลง สิ่งนี้เป็นความจริงโดยทั่วไปมันไม่มีเหตุผลถ้าคุณเพิ่มสเปกตรัมของของผสมที่มีองค์ประกอบ 2 อย่างลงในของผสมที่มีองค์ประกอบ 3 อย่าง ในกรณีนี้มีความเสี่ยงที่ของผสมที่มีองค์ประกอบ 2 อย่างจะไม่มีอยู่จริงและโดยการเพิ่มมันลงไปในแบบจำลองจะทำให้ได้ผลเลวลงโดยไม่จำเป็น โดยกฎทั่วไปสำหรับการสร้างแบบจำลองที่มีประโยชน์คือตัวอย่างของชุดคาลิเบรชั่นควรครอบคลุมความแปรปรวนโดยธรรมชาติอย่างสมบูรณ์ (complete natural variance) ขององค์ประกอบที่ต้องการวัดอย่างสม่ำเสมอ (homogeneously) ไม่ต้องมากไม่ต้องน้อย

34. มีการแนะนำการซ่อมแซมวิธีการเคโมเมตริก (แบบจำลอง) หรือไม่ (นั่นคือควรมีการตรวจสอบคุณภาพเป็นระยะ) แต่ฉันจะต้องทำอย่างไรถ้าฉันพบว่าแบบจำลองค่อยๆเลวลงเมื่อเวลานานขึ้น
ให้เพิ่มตัวอย่างที่มีคุณสมบัติใหม่ลงในแบบจำลองเดิมหรือแบบจำลองทีมีการพิสูจน์ใหม่ (re-validation) การพิสูจน์ใหม่อาจนำไปสู่ชุดพารามิเตอร์ใหม่ (ช่วงความถี่ วิธีการจัดการสเปกตรัมเบื้องต้น จำนวนแฟกเตอร์) ซึ่งใช้คุณสมบัติใหม่ในการพิจารณา

[1] “The copyright is belong to Dr. Jörg-Peter Conzen”

04 ตุลาคม 2561

ผู้ชม 3273 ครั้ง

More.