CHAPTER 5 SELECTION CRITERIA FOR A PLS CALIBRATION

CHAPTER 5 SELECTION CRITERIA FOR A PLS CALIBRATION - METHOD OPTIMIZATION

หมวดหมู่: Translated book

บทที่ 5
เกณฑ์ในการเลือกสำหรับการทำคาลิเบรชั่นแบบ PLS; การทำให้วิธีเหมาะสม
SELECTION CRITERIA FOR A PLS CALIBRATION; METHOD OPTIMIZATION

โดยหลักการมีความเป็นไปได้ในการสร้างแบบจำลองเคโมเมตริกได้มากมาย อย่างไรก็ตาม โดยทั่วไปมีความเป็นไปได้ที่จะได้ผลการวิเคราะห์ที่พอใจ โดยทำให้แบบจำลองเหมาะสมโดยใช้ตัวแปรของระบบเพียง 2-3 ตัวแปรเท่านั้น

ในบริบทนี้เป็นการเลือกช่วงของสเปกตรัมของชุดคาลิเบรชั่น การเลือกวิธีการจัดการข้อมูลเบื้องต้น การเลือกและคุณภาพของมาตรฐานของการคาลิเบรชั่นเป็นสิ่งสำคัญ ในบทนี้จะอธิบายถึงเกณฑ์การเลือกที่สำคัญที่สุด ทำให้ผู้วิเคราะห์สามารถทำให้การวัดเหมาะสม (ดีที่สุด)

A. การเลือกช่วงความเข้มข้นและค่าองค์ประกอบ (Selecting the Concentration Range and Component Values)

ช่วงความเข้มข้นที่ใช้ทำคาลิเบรชั่นควรจะกว้างมากกว่าช่วงของความเข้มข้นของตัวอย่างเล็กน้อย โดยวิธีนี้แบบจำลองจะมีความครอบคลุม “Robust” เมื่อพิจารณาค่าองค์ประกอบซึ่งมีขีดจำกัดอยู่ในช่วงคาลิเบรชั่น ซึ่งสิ่งนี้มีความสำคัญ เช่น ถ้าต้องการวิเคราะห์ชุดตัวอย่างที่เลว “bad batches” จากกระบวนการผลิตให้แม่นยำ สิ่งเหล่านี้มักมีการเบี่ยงเบนอย่างมีนัยสำคัญของค่าความเข้มข้น และช่วงความเข้มข้นที่จะใช้ในการคาลิเบรชั่นจะต้องมีความกว้างอย่างเพียงพอเพื่อที่จะให้การวิเคราะห์ตัวอย่างเชื่อถือได้ รูปที่ 5.1 แสดงการเปรียบเทียบค่าอ้างอิงและค่าการวิเคราะห์ (ด้วยแบบจำลอง)

รูปที่ 5.1 การเลือกช่วงของความเข้มข้น : ตัวอย่างที่อยู่ในช่วงความเข้มข้นที่ “พบได้ทั่วไป” จะให้ผลลัพธ์ที่แม่นยำ แต่ตัวอย่างที่มีของความเข้มข้นขององค์ประกอบทางเคมีออกนอกช่วงจะให้ผลลัพธ์ที่ไม่แม่นยำ

ค่าขององค์ประกอบใดๆ ควรกระจายอยู่ตลอดในช่วงทั้งหมดของความเข้มข้นอย่างเท่าๆกัน ไม่แนะนำให้นำตัวอย่างที่อยู่นอกช่วงปกติมารวมในชุดข้อมูลคาลิเบรชั่น (ดูรูปที่ 5.1) ถ้าหากช่วงความเข้มข้นของแบบจำลองที่มีอยู่จำเป็นต้องขยายออก ก็จะเป็นที่จะต้องขยายขอบเขตชุดข้อมูลให้กว้างขึ้น

B. การสร้างตัวอย่างคาลิเบรชั่นที่เป็นตัวแทน (Creating Representative Calibration Samples)

จุดที่มีความสำคัญอีกจุดหนึ่งที่ต้องพิจารณาถึงคือ สิ่งรบกวนจากภายนอก ซึ่งสามารถเกิดขึ้นได้ระหว่างการวัดตัวอย่างและเป็นสิ่งที่ไม่สามารถหลีกเลี่ยงได้โดยวิธีการเตรียมตัวอย่างที่เหมาะสม ตัวอย่างเช่น การวัดเชิงสเปกตรัมในสายการผลิตของกระบวนการทางเคมี จากที่เห็นได้บ่อย ๆ คือ การเตรียมหรือการวัดอุณหภูมิความร้อนของตัวอย่างเป็นสิ่งที่ไม่สามารถเป็นไปได้ ในทางเดียวกัน การควบคุมคุณภาพสมัยใหม่นั้นโดยมากไม่อนุญาตให้มีการเตรียมตัวอย่างที่มีขอบเขตกว้างมากเกินไป แต่ถ้าหากมีเทคนิคช่วยให้มีความเป็นไปได้มากขึ้น ราคาก็มักจะสูงขึ้นตามไปด้วย

ในที่นี้ เคโมเมทริกเป็นเครื่องมือที่สำคัญในการแก้ไขปัญหาดังกล่าว การทับซ้อนกันหรือความผิดปกติในรูปร่างของสัญญาณของตัวอย่าง ซึ่งมีสาเหตุมาจากการปนเปื้อนหรือจากความแปรปรวนของอุณหภูมิจากตัวอย่าง เหล่านี้สามารถจัดการได้โดยวิธีสร้างแฟคเตอร์ (Factorization of the spectra) เนื่องจากพารามิเตอร์ของระบบที่เกี่ยวข้องถูกเก็บไว้ที่เป็นตัวบล็อกข้อมูลที่มีความเป็นอิสระ (นั่นคือ แฟคเตอร์) สิ่งรบกวนที่เข้ามาทับซ้อนในสเปกตรัมสามารถถูกกำจัดออกไปโดยง่าย เพื่อวัตถุประสงค์นี้ สิ่งรบกวนที่มีศักยภาพทั้งหมดถูกนำมาเลียนแบบระหว่างการคาลิเบรชั่น และถูกนำมาจัดเก็บเป็นแฟคเตอร์อิสระ เมื่อเปรียบเทียบค่าต่าง ๆ เหล่านี้กับค่าอ้างอิงขององค์ประกอบทางเคมีของตัวอย่าง อัลกอริธึมจะ “ตรวจสอบ” ว่าข้อมูลนี้ไม่ได้มาจากตัวองค์ประกอบทางเคมีเอง ดังนั้นโครงสร้างที่สอดคล้องกันจะไม่ถูกนำมาใช้เพื่อการทำนายตัวอย่างใหม่ที่รู้จักมาก่อน กล่าวได้อีกอย่างหนึ่งว่า อัลกอริธึมของ PLS สามารถแยกแยะ ระหว่างสิ่งที่เกี่ยวข้องเพื่อการวิเคราะห์กับโครงสร้างที่ไม่ประโยชน์ในการวิเคราะห์สเปกตรัม สิ่งรบกวนจะถูกตรวจจับได้ระหว่างการคาลิเบรชั่น และถูกกำจัดออกไปจากขั้นตอนการวิเคราะห์ต่อไป

หน้าที่ของผู้พัฒนาวิธีการ คือ การวัดตัวอย่างในสภาพที่เป็นจริง ดังนั้น สิ่งรบกวนที่มีศักยภาพทั้งหลายที่เข้ามาแทรกแซงในระบบควรถูกนำมาพิจารณาเพื่อทำให้อัลกอริธึม “เรียนรู้” เพื่อจะได้จดจำและกำจัดสิ่งรบกวนเหล่านั้นออกไป ความแปรปรวนทั้งหลายที่สามารถเกิดขึ้นได้ในความเป็นจริงควรถูกนำมาพิจารณาสำหรับตัวอย่างชุดคาลิเบรชั่น เพียงเท่านี้ก็สามารถแน่ใจได้ว่าชุดตัวอย่างนี้สามารถใช้เป็นตัวแทนและมีความเหมาะสมในการพัฒนาวิธีการ ดังนั้น จึงไม่แนะนำให้ทำการคาลิเบรชั่นภายใต้สภาพเงื่อนไขที่เป็นอุดมคติ (ไม่เป็นจริง) ที่สุด ในการวัดตัวอย่างของสารบริสุทธิ์ที่ควบคุมอุณหภูมิอย่างดี จะนำไปสู่ค่าความผิดพลาดที่น้อยมากในการวิเคราะห์ แต่แบบจำลองจะไม่ครอบคลุมสภาวะเป็นจริง (Robust) เพียงพอในการนำมาใช้ในภาคปฎิบัติ ผลกระกระทบของอุณหภูมิของตัวอย่างแสดงโดยตัวอย่างต่อไปนี้ เนื่องจากมีพันธะไฮโดรเจน สเปกตรัมของน้ำจึงมีความไวต่ออุณหภูมิที่เปลี่ยนไปมาก เมื่ออุณหภูมิเพิ่มขึ้นโมเลกุลของน้ำจะเคลื่อนที่เร็วขึ้นซึ่งจะนำไปสู่การแตกตัวของพันธะไฮโดรเจน อิเล็กตรอนจะเคลื่อนที่กลับสู่พันธะ O-H ซึ่งนำไปสู่การเพิ่มขึ้นของค่าคงที่ของแรง โมเลกุลจะสั่นสะเทือนมากขึ้นและการดูดซับคลื่นในสเปกตรัมจะขยับไปที่ความถี่ (จำนวนคลื่น Wavenumber) สูงขึ้น ยิ่งน้ำถูกทำให้ร้อน พีคการดูดซับคลื่นของน้ำจะยิ่งขยับไปที่จำนวนคลื่นมากขึ้น นอกจากนี้น้ำจะขยายตัวเมื่ออุณหภูมิสูง ทำให้ความหนาแน่นลดลงซึ่งทำให้ความสูงของสัญญาณลดลง ดังนั้นเมื่ออุณหภูมิเพิ่มขึ้นสเปกตรัมของน้ำจะลดความเข้มของสัญญาณลงและพีคจะขยับมาทางเลขคลื่นที่สูงขึ้น (ดูรูปที่ 5.2)

รูปที่ 5.2 อิทธิพลของอุณหภูมิต่อ 1^st overtone ของน้ำ (ทางแสงผ่าน 1 mm, สารอ้างอิงเป็นอากาศ)

สำหรับแม้แต่ความแตกต่างของอุณหภูมิที่มากขึ้น การขยายออกและการบิวเบี้ยวของสเปกตรัมสามารถสังเกตเห็นได้ ผลนี้เกิดจากความแตกต่างของความหนาแน่นของระดับการสั่นสะเทือนแบบหมุนของโมเลกุล เพื่อให้ง่าย จะไม่แสดงการอธิบายลักษณะของกราฟที่เกิดจากสิ่งที่กล่าวข้างต้น

มีความชัดเจนที่ว่าการคาลิเบรชั่นสารละลายที่ควบคุมอุณหภูมิไม่สามารถให้ผลที่น่าเชื่อถือถ้าการวิเคราะห์ถูกกระทำที่อุณหภูมิแตกต่างกันต่อไป ถ้าการคาลิเบรชั่นถูกดำเนินการภายใต้การกำหนดสภาวะอย่างจริงจัง มันเป็นสิ่งที่จำเป็นที่ต้องทำให้เหมือนเดิมในระหว่างการวิเคราะห์ นอกจากนั้น มีข้อพิจารณาว่าวิธีการเคโมเมทริกซ์จะต้องถูกปรับตามการเปลี่ยนแปลงในองค์ประกอบของผลิตภัณฑ์หรือคุณภาพของผลิตภัณฑ์ สิ่งนี้จะจริงถ้าการวัดพารามิเตอร์เปลี่ยนแปลงไป โดยทั่วไปวิธีการจะทำงานได้เฉพาะภายใต้สภาวะซึ่งอยู่ภายใต้การปรับตั้งขึ้น และเฉพาะสิ่งรบกวนเหล่านั้นถูกรับรู้ซึ่งถูกครอบคลุมในการคาลิเบรชั่น สำหรับเหตุผลนี้ จึงต้องการการบำรุงรักษาวิธีการซึ่งมักจะทำที่ขั้นตอนต่อไป

การปรับตั้งและการบำรุงรักษาวิธีการป็นสิ่งที่ง่ายทีเดียว โดยมันไม่จำเป็นต้องสัมพันธ์ค่าอ้างอิงกับการรบกวนหรือค่าของอุณหภูมิ สิ่งนี้เป็นผลจากการทำแฟคเทอไรเซชั่น (Factorization) เพื่อที่จะชดเชยการรบกวนที่ไม่ต้องการในสมการคาลิเบรชั่นหลายตัวแปร ค่าการวิเคราะห์ที่คำนวณได้ไม่ถูกแก้ไขโดยฟังชั่นการปรับแต่งซึ่งสร้างขึ้นภายใน การทำอัลกอริธึม PLS1 มีเป้าหมายที่จะหาความสัมพันธ์ระหว่างองค์ประกอบและโครงสร้างของสเปกตรัม ข้อมูลอื่นๆไม่ได้ถูกคำนึงถึง มันไม่มีความแตกต่างว่ามันจะมีสาเหตุจากการปนเปื้อน สารที่จะวิเคราะห์ต่อไปหรือสัญญาณรบกวนสเปกตรัม (ดูในบทที่ 2)

ดังนั้นสิ่งนี้จึงเพียงพอสำหรับการทำคาลิเบรชั่นที่จะมีกลุ่มข้อมูลซึ่งถูกวัดภายใต้สภาวะที่แท้จริง ค่าของข้อมูลอ้างอิงขององค์ประกอบที่มีการรบกวนไม่มีความสำคัญ จากตัวอย่างข้างต้นนั้นสำหรับการทำคาลิเบรชั่นของสารละลาย มันเพียงพอที่จะวัดตัวอย่างที่ช่วงที่เป็นตัวแทนชองอุณหภูมิ การบันทึกอุณหภูมิไม่มีความจำเป็น เช่นเดียวกันถ้ามีการเปลี่ยนแปลงคุณภาพของตัวอย่างทำให้ต้องปรับปรุงแบบจำลอง จะต้องเพิ่มตัวอย่างของข้อมูลชุดใหม่ถูกเข้าสู่แบบจำลองที่มีอยู่ ต่อจากนั้นแบบจำลองก็ควรทำงานได้อย่างน่าเชื่อถืออีกครั้ง

C. อิทธิพลของสภาวะแวดล้อมที่มีผลต่อเครื่องมือวัด (Ambient Influences on the Instrument)

ตัวอย่าง(ที่เป็นตัวแทน)ในชุดคาลิเบรชั่นเป็นสิ่งแรกที่ทำให้แบบจำลองเคโมเมทริกมีความเสถียร มันชัดเจนว่าอิทธิพลของสภาพแวดล้อมที่มารบกวนมีผลต่อลักษณะของตัวอย่าง และลักษณะของการวัดของเครื่องมือวัดด้วย ในกรณีของ optical spectroscopy ขึ้นอยู่กับอุณหภูมิของสภาพแวดล้อม รวมถึงอิทธิพลของสภาพบรรยากาศ เช่น การแพร่ของ CO₂ หรือไอน้ำ ใน และ/หรือ จากสเปกโทรมิเตอร์ ซึ่งอธิบายได้ดังตัวอย่างต่อไปนี้

ในขณะที่การแพร่ของ CO₂ และ H₂O จะทำให้เกิดการรบกวนอย่างมากต่อสเปกตรัมของ MIR ใน NIR-สเปกโทรสโกปี โดยเฉพาะน้ำที่ปนอยู่ในบรรยากาศ ซึ่งแทรกซึมเข้าสู่เครื่องมือ มีผลต่อการวัดอย่างชัดเจน

รูปที่ 5.3 แสดงอิทธิพลของความชื้นที่แพร่เข้าสู่ NIR-สเปกโทรมิเตอร์ สเปกตรัมแรกจะถูกวัดทันทีหลังจากการวัดวัสดุอ้างอิง จะเห็นว่าไม่มีสิ่งรบกวนเมื่อเพิ่มตัวดูดซับไอน้ำ หลังจากการวัดเครื่องถูกนำไปวางในพื้นที่ที่มีความชื้นสูงผิดปกติ สเปกตรัมต่อมาที่ถูกวัด 1 สัปดาห์ถัดมาโดยไม่มีการวัดวัสดุอ้างอิงใหม่ จะเห็นว่ามีโครงสร้างแหลมมากมากมายในช่วงสเปกตรัมอยู่ที่ประมาณ 7,500 – 6,700 cm^-1 และ 5,800 – 5,000 cm^-1 ซึ่งซ้อนทับสเปกตรัมเดิม สิ่งรบกวนมีผลต่อโครงสร้างเดิมอย่างมากจนไม่สามารถจำโครงสร้างเดิมได้

ช่วงของสเปกตรัมซึ่งแสดงการรบกวนต้องไม่รวมเข้าในการประเมิน วิธีการจะต้องตั้งค่าโดยปราศจากช่วงของสเปกตรัมเหล่านั้น ถ้ามันเป็นไปไม่ได้ จะต้องวัดสเปกตรัมใหม่ของวัสดุอ้างอิงในช่วงสั้นๆ หรือเครื่องมือจะต้องมีการระบายอากาศ

รูปที่ 5.3 สเปกตรัมการดูดซับก่อน (บน) และหลัง (ล่าง) การแพร่ของความชื้นของอากาศเข้าสู่สเปกโตรมิเตอร์แบบ NIR (MATRIX-F, Bruker Optik GmbH) สเปกตรัมที่ถูกขยับขึ้นในแกน y เพื่อทำให้เห็นได้ง่ายขึ้น

D. ปัญหาของความเป็นเชิงเส้นแบบร่วม (Collinearity)

โดยหลักการ จะมีอยู่ 2 วิธีการที่จะใช้สร้างชุดข้อมูลคาลิเบรชั่น วิธีแรกคือตัวอย่างสามารถถูกวัดและค่าอ้างอิงสามารถถูกวัดได้เช่นกันด้วยวิธีการวิเคราะห์ (มาตรฐาน) ที่เป็นอิสระ ในทางกลับกันตัวอย่างสามารถถูกทำขึ้นเองได้ในห้องปฏิบัติการ นอกจากการกระจายระดับความเข้มข้นให้สม่ำเสมอกันตลอดช่วงความเข้มข้นทั้งหมด (ดูที่ผ่านมา) ในกรณีที่มีหลายองค์ประกอบรวมกันอยู่ มันมีความสำคัญว่าปริมาณความเข้มข้นขององค์ประกอบต้องไม่เปลี่ยนแบบเป็นเชิงเส้นแบบร่วม (Collinearity) นั่นหมายความว่าความเข้มข้นของแต่ละองค์ประกอบ ต้องไม่เพิ่มขึ้นหรือลดลงอย่างเท่าๆกันในแต่ละตัวอย่าง (รูปที่ 5.4)

ในกรณีของชุดข้อมูลเชิงเส้นแบบร่วม PLS อัลกอริธึมไม่สามารถกำหนดแถบสเปกตรัมได้ชัดเจนต่อค่าองค์ประกอบที่สอดคล้องกัน วิธีการที่สร้างขึ้นในลักษณะนี้จะไม่ได้ผลสำหรับการวิเคราะห์ชุดข้อมูลที่ไม่เป็นเชิงเส้นแบบร่วม (Non-collinear data sets)

รูปที่ 5.4 แถวบน : ชุดข้อมูลเชิงเส้นแบบร่วมมีตัวอย่าง 3 ตัวอย่างที่มีองค์ประกอบ “A” และ “B” องค์ประกอบหนึ่งเปลี่ยนแปลงไปสำหรับทั้งสามตัวอย่างในลักษณะเดียวกัน นั่นคือชุดข้อมูลเชิงเส้นแบบร่วม แถวล่าง : ไม่ใช่ชุดข้อมูลเชิงเส้นแบบร่วม คือองค์ประกอบไม่เปลี่ยนแปลงอย่างมีระบบ

ชุดข้อมูลคาลิเบรชั่นแบบเชิงเส้นแบบร่วม จะใช้ได้หากมั่นใจได้ว่าค่าองค์ประกอบของตัวอย่างที่จะวิเคราะห์ในอนาคตเป็นเชิงเส้น ตัวอย่างเช่นนี้จริงสำหรับทุกระบบที่มีสององค์ประกอบ โดยการเพิ่มขึ้นของความเข้มข้นขององค์ประกอบหนึ่งที่นำไปสู่การลดลงของ (นั่นคือเชิงเส้น) ที่สอดคล้องกันขององค์ประกอบอีกชนิดหนึ่งเนื่องจากค่าทั้งสองต้องรวมกันเท่ากับ 100%

แต่ระบบหลายองค์ประกอบที่ซับซ้อนก็แสดงให้เห็นความเป็นเชิงเส้นแบบร่วม (Collinearity) ตามธรรมชาติ ตัวอย่างเช่นในการผลิตพลาสติก ระดับพอลิเมอไรเซชั่นของผลิตภัณฑ์มักจะเพิ่มขึ้นอย่างเท่าเทียมกันกับปริมาณสารสกัด ด้วยวิธีนี้การหาค่าที่ถูกต้องของระดับพอลิเมอไรเซชั่นจะประสบความสำเร็จด้วยความช่วยเหลือของการวิเคราะห์ทางสเปกโทรสโกปี ความเข้มข้นของวัสดุพื้นฐาน (ไม่ใช่ระดับพอลิเมอไรเซชั่น) จะถูกพิจารณา แต่เนื่องจากการเชื่อมโยงโดยตรง (Collinear) ของทั้งสองพารามิเตอร์ การวิเคราะห์จะสำเร็จได้อย่างง่ายดาย ซึ่งหลักการนี้ใช้ได้ทั่วไป ปัจจุบันนี้พารามิเตอร์ทางฟิสิกส์ส่วนมาก สารที่ไม่มีปฏิกิริยากับ IR หรือ ความเข้มข้นที่ต่ำกว่าค่าจำกัดที่วัดได้ สามารถถูกพิจารณา (หาหรือวัด) ได้อย่างง่ายด้วยความช่วยเหลือของ NIR สเปกโทรสโกปี ถ้าค่าเหล่านี้มีความเป็นเชิงเส้น (Collinearly) ซึ่งค้นพบได้กับองค์ประกอบที่วัดได้อื่นๆ

จะเป็นไปไม่ได้อย่างชัดเจนถ้าค่าองค์ประกอบสามารถเปลี่ยนแปลงเป็นอิสระจากกัน ในกรณีนี้ควรจะตั้งข้อสังเกตว่าค่าเหล่านี้มีการกระจายทางสถิติครอบคลุมทุกตัวอย่าง ดังนั้นจึงไม่แนะนำให้สร้างมาตรฐานสำหรับคาลิเบรชั่นจากชุดตัวอย่างที่ทำการเจือจาง เนื่องจากไม่เพียงแต่องค์ประกอบที่ต้องการวัดจะเจือจางแต่องค์ประกอบอื่นๆจะเจือจางไปด้วย อัลกอริธึมไม่สามารถแยกความแตกต่างระหว่างค่าแต่ละอย่างและการพิสูจน์จะนำไปสู่ผลลัพธ์ที่ไร้ประโยชน์

ในบริบทนี้จะไม่แนะนำให้วัดค่าความเข้มข้นของชุดคาลิเบรชั่นมาตรฐานในลำดับจากน้อยไปหามากหรือลำดับจากมากไปหาน้อย การเปลี่ยนแปลงของระบบในตัวอย่าง เช่น การเพิ่มขึ้นของอุณหภูมิระหว่างชุดของการวัดสามารถจำลองความสัมพันธ์กับคุณสมบัติของระบบ การวัดตัวอย่างอีกครั้งในขั้นตอนภายหลังและเปรียบเทียบกับสเปกตรัมที่วัดก่อนหน้านี้จะรับประกันว่าไม่มีการเปลี่ยนแปลงของระบบถูกรวมอยู่ในการคาลิเบรชั่น
มันมีประโยชน์ที่จะคำนึงถึงปัญหาของความสัมพันธ์เชิงเส้นแบบร่วม (collinearity) จากจุดเริ่มต้นเมื่อเริ่มสร้างชุดข้อมูลคาลิเบรชั่น หลังจากนั้นก็อาจจะไม่ง่ายที่จะรู้ว่าค่าองค์ประกอบเดี่ยวจะเปลี่ยนแปลงไปในทางที่มีความสัมพันธ์เชิงเส้น (collinear) ซึ่งแสดงดังตัวอย่างต่อไปนี้:
ตารางที่ 5.1 ตัวอย่างของชุดข้อมูลที่มีความสัมพันธ์เชิงเส้นตรง

เลขที่	X	X^.3.9	X^. 0.4	X / 120	(X^. 0.3) + 15	100 - 2X	50 – (X^. 1.7)
1	1	3.9	0.4	0.00833333	15.3	98	48.3
2	2	7.8	0.8	0.01666667	15.6	96	46.6
3	5	19.5	2	0.04166667	16.5	90	41.5
4	7	27.3	2.8	0.05833333	17.1	86	38.1
5	8	31.2	3.2	0.06666667	17.4	84	36.4
6	9	35.1	3.6	0.075	17.7	82	34.7
...	...	...	...	...	...	...	...

จำนวนในแต่ละคอลัมน์สามารถสร้างขึ้นโดยการแปลงอย่างง่ายจากตัวเลขในคอลัมน์ "X" ดังนั้นมันจึงมีความสัมพันธ์เป็นเชิงเส้นแบบร่วม เรียกว่า collinear สิ่งนี้สามารถประยุกต์ใช้ไม่เพียงแต่เฉพาะคอลัมน์แรก ตัวเลขของแต่ละคอลัมน์มีความสัมพันธ์เป็นเชิงเส้นแบบร่วม (collinearly) กับตัวเลขในคอลัมน์อื่นๆของทุกๆ คอลัมน์ การเปลี่ยนแปลงสัมพัทธ์ขององค์ประกอบต่างๆมีค่าเหมือนกันสำหรับแต่ละตัวอย่าง อย่างไรก็ตาม collinearly อาจไม่เป็นที่รู้จักตั้งแต่แรกเห็น ดังนั้นจึงมีประโยชน์ที่จะให้ความสนใจกับการกระจายอย่างอิสระของค่าแต่ละองค์ประกอบในตอนเริ่มต้น

E. การวัดแบคกราวน์ (Performing a Background Measurement)

สำหรับการวัดเชิงสเปกโทรสโกปิกส่วนใหญ่ จะแนะนำให้ดำเนินการตรวจวัดแบคกราวน์ใหม่เป็นครั้งคราว ด้วยวิธีนี้อิทธิพลของสภาพแวดล้อมต่อการวัด (เช่น สเปกโทรมิเตอร์ ใยแก้วนำแสง คิวเวต ฯลฯ) จะได้รับการชดเชย ดังนั้นการวิเคราะห์ที่ต้องการความแม่นยำสูงจึงสามารถเป็นไปได้

เมื่อเลือกวัสดุอ้างอิง ควรใช้ความระมัดระวังว่าสารเหล่านี้ควรเป็นสารเฉื่อยมากเท่าที่เป็นไปได้และเป็นสารที่แสดงการดูดซับคลื่นในช่วงสเปกตรัมซึ่งเกี่ยวข้องกับการประเมินผล ขั้นตอนการวัดแบคกราวน์ต่อไปนี้ได้ถูกพิสูจน์แล้วว่ามีประโยชน์ในการทำ (N)IR-สเปกโทรสโกปี:

การวัดก๊าซ:

MIR: สุญญากาศหรือไนโตรเจนแห้ง

NIR: อากาศทั่วๆไป, หรืออาจใช้สุญญากาศ หรือไนโตรเจนแห้ง (ใช้น้อย)

การวัดของเหลว:

MIR: อากาศทั่วๆไป, ในบางกรณีตัวทำละลายบริสุทธิ์ (เฉพาะที่อุณหภูมิคงที่; ดูรายละเอียดด้านล่าง)

NIR: อากาศทั่วๆไป

การวัดของแข็ง:

MIR: potassium bromide หรือ caesium iodide แห้ง

NIR: เทฟลอนหรือพื้นผิวโลหะที่ขรุขระซึ่งกระจายแสง (ส่วนใหญ่เป็นทอง)

ในสเปกโทรสโกปีแบบราแมน โดยปกติจะไม่มีการวัดแบคกราวน์ (background)

อิทธิพลของแก๊สในบรรยากาศ (เช่น CO₂และ H₂O) ต่อการวัดในช่วงอินฟราเรดย่านกลาง โดยปกติจะมีผลสูงมากจนเครื่องสเปกโตรมิเตอร์จำเป็นจะต้องไล่อากาศออกด้วยการผ่านไนโตรเจนเข้าไป

ในทางตรงกันข้าม การวัดแบบ NIR มีความไวน้อยและได้รับผลกระทบอย่างเห็นได้ชัดต่อน้ำในบรรยากาศ โดยทั่วไปการถูกรบกวนจะถูกชดเชยด้วยการอ้างอิงปกติ (เช่นทุกชั่วโมง) ดังนั้นรูปแบบในการประยุกต์ใช้ในห้องปฏิบัติการสามารถกระทำได้ในแบบ NIR โดยไม่ต้องระมัดระวังอิทธิพลนี้ อย่างไรก็ตามไม่สามารถประยุกต์ใช้กับกระบวนการส่วนใหญ่ อุปกรณ์มักจะทำงานเป็นเวลาหลายเดือนโดยใช้แบคกราวน์เดียวกัน การเปลี่ยนแปลงความชื้นของอากาศรอบนอกมีผลต่อการวิเคราะห์ในช่วงสเปกตรัมประมาณ 7, 500-6, 700 cm^-1 และประมาณ 5, 800-5, 000 cm^-1 (ดูจากด้านบน) ถ้าช่วงนี้เป็นสิ่งสำคัญสำหรับการประเมินผล อุปกรณ์เหล่านี้จะถูกผ่านด้วยไนโตรเจนหรืออากาศที่ปราศจากน้ำมัน เพื่อไล่อากาศชื้นออก

การใช้วัสดุอ้างอิงที่ไม่ดูดซับคลื่นหรือดูดซับคลื่นต่ำและเฉื่อยเป็นสิ่งที่จำเป็นสำหรับการทำมาตรฐาน (Standardization) ของสเปกตรัมและวิธีการดังกล่าวมาแล้วใน NIR สเปกโทรสโกปี ความสูง ความกว้าง รูปร่าง ตำแหน่งของแถบการดูดซับคลื่นขึ้นอยู่กับอุณหภูมิรอบนอก ถ้าการวัดวัสดุอ้างอิงและการวัดตัวอย่างไม่ได้ถูกบันทึกไว้ที่อุณหภูมิเดียวกันจะสามารถเห็นสิ่งที่ไม่เป็นธรรมชาติ (artefacts) ของวัสดุอ้างอิง ถ้าวัสดุอ้างอิงแสดงการดูดซับคลื่นในช่วงสเปกตรัมนั้นๆ ซึ่งจะปรากฏว่าว่าที่ความถี่เดียวกันที่การดูดซับของคลื่นที่เกิดขึ้นในวัสดุ แสดงดังรูปที่ 5.5 โดยเป็นตัวอย่างของการวัด NIR สเปกโทรสโกปีของน้ำ

รูปที่ 5.5 โครงสร้างของสเปกตรัมซึ่งเกิดจากการขยายตัวของ 1^st overtone ของน้ำซึ่งเพิ่มขึ้นตามอุณหภูมิที่สูงขึ้น สำหรับการวัดแบคกราวน์และตัวอย่างจะใช้น้ำบริสุทธิ์ โดยวัดแบคกราวน์ที่อุณหภูมิ 30 ºC ส่วนตัวอย่างวัดที่อุณหภูมิเพิ่มขึ้นถึง 60 ºC

ตัวอย่างเช่นเดียวกับในรูปที่ 5.2 ถูกวัดโดยการวัดวัสดุอ้างอิงวัดเทียบกับอากาศและไม่พบสิ่งรบกวนใดๆ ขณะนี้โดยที่มีน้ำเป็นวัสดุอ้างอิง โครงสร้างสามารถสังเกตได้ซึ่งซ้อนทับสเปกตรัมเดิม สิ่งนี้มีผลกระทบที่มารบกวนต่อการประเมินทางเคโมเมทริก ในการวัดเทียบกับอากาศจะแสดงค่าที่มีการขจัดเล็กน้อย (ดูรูปที่ 5.2) ซึ่งมีผลกระทบต่อการวิเคราะห์น้อยกว่า ดังนั้นจึงเป็นเรื่องที่ชัดเจนว่าในสเปกโทรสโกปีแบบการสั่น (Vibrational spectroscopy) โดยทั่วไปการใช้ตัวอย่างในการวัดแบคกราวน์เป็นสิ่งไม่มีประโยชน์

สมการต่อนี้ใช้ในการวิเคราะห์ทางเคมี

[สเปกตรัมของสารประกอบ] - [สเปกตรัมของเมทริกซ์] = [สเปกตรัมของสารบริสุทธิ์ที่วิเคราะห์]

หรือ พูดง่ายๆ คือ

[เมทริกซ์+สารที่วิเคราะห์]-[เมทริกซ์]=[สารที่วิเคราะห์]

ไม่สามารถใช้ในเนียร์อินฟราเรด (NIR) และ ราแมน (Raman) สเปกโทรสโกปี (หรือเฉพาะที่แบล็คกราวน์ (สิ่งแวดล้อม) และตัวอย่างมีอุณหภูมิเดียวกัน) โดยเฉพาะอย่างยิ่ง การวัดแบล็คกราวน์ควรวัดเทียบกับอากาศ (หรือก๊าซไนโตรเจน) หรือเทียบกับวัสดุอ้างอิงที่ไม่แสดงแถบการดูดกลืนในช่วงสเปกตรัมที่เกี่ยวข้อง

F. ความสำคัญของพารามิเตอร์ที่วัดและค่าอ้างอิง (The Importance of Measurement Parameters and Reference Values)

ในการวิเคราะห์สเปกตรัมของ FT-NIR และราแมน (Raman) จำนวนจุดข้อมูลสเปกตรัมจะมีมากกว่า จำนวนองค์ประกอบทางเคมีมาก ค่าองค์ประกอบทุกชนิดจึงไม่เกี่ยวข้องกับจุดสเปกตรัมหนึ่ง (เช่นเดียวกับกรณีการคาลิเบรชั่นแบบตัวแปรเดียว) แต่เกี่ยวกับสเปกตรัมทั้งเส้น ระบบจึงมีข้อมูลอยู่จำนวนมากกว่ามาก ดังนั้น มันเป็นไปได้สำหรับอัลกอริธึม PLS ที่จะชดเชย (ถึงระดับหนึ่ง) ต่อความแปรปรวนทางสถิติของชุดข้อมูลคาลิเบรชั่น แต่มันก็ยังเป็นที่ชัดเจนว่าแบบจำลองที่แน่นอนไม่สามารถได้มาจากชุดข้อมูลที่ไม่เพียงพอ เพราะฉะนั้น คุณภาพของสเปกโทรมิเตอร์มีผลกระทบต่อคุณภาพของแบบจำลองที่สร้างขึ้น (เช่นความละเอียด ความเสถียร อัตราส่วนสัญญาณต่อสิ่งรบกวน และโดยเฉพาะอย่างยิ่งความแม่นยำของการวัด) ความสำคัญในบริบทนี้ คือ คุณภาพของของข้อมูลอ้างอิงและความระมัดระวังในการเตรียมตัวอย่าง จากประสบการณ์ แสดงให้เห็นว่าในกรณีส่วนใหญ่แบบจำลองเคโมเมทริกที่ไม่ดี จะได้จากเทคนิคการวัดค่าอ้างอิงที่ไม่แม่นยำเพียงพอ และจากการเตรียมตัวอย่างที่ไม่ดี มันชัดเจนดังตัวอย่างเช่นการแปรปรวนของอุณหภูมิของตัวอย่างระหว่างการวัด หรือการศึกษาเกี่ยวกับตัวอย่างที่มีเนื้อไม่สม่ำเสมอหรือไม่บริสุทธิ์ อาจนำไปสู่ความผิดพลาดอย่างวิกฤตในการวิเคราะห์ ถ้าหากไม่คำนึงถึงในวิธีการ ค่าความผิดพลาดของการวัดของสเปกโตรมิเตอร์หรือความไม่แม่นยำที่เกี่ยวข้องกับแบบจำลอง PLS มักจะเป็นสิ่งสำคัญที่ถูกละเลย ดังนั้นมันจึงเป็นสิ่งที่จะต้องคำนึงถึงเป็นเบื้องต้น เช่นเดียวกับวิธีอ้างอิง (วิธีทางวัดจริง) ที่เชื่อถือได้ซึ่งจะนำไปสู่การวิเคราะห์ที่มีคุณภาพ ถ้าคุณภาพของข้อมูลอ้างอิงยากหรือเป็นไปไม่ได้ที่จะปรับปรุง มีข้อแนะนำว่าควรวัดตัวอย่างหนึ่งๆหลายๆซ้ำแล้วหาค่าเฉลี่ยซึ่งความแปรปรวนทางสถิติจะถูกเฉลี่ยและค่านอกกลุ่ม (outlier) ที่มีอยู่จะมีผลน้อยลงมากต่อคุณภาพของการวิเคราะห์ สิ่งนี้เป็นความจริงสำหรับการวิเคราะห์แบบสเปกโทรเมทริก ซึ่งกรณีที่วิกฤต ความผิดพลาดสามารถทำให้น้อยลงได้โดยการวัดซ้ำและหาค่าเฉลี่ย

G. การเลือกบล็อกของชุดข้อมูลสเปกตรัม (Selecting the Spectral Data Block)

โดยหลักการ ไม่มีข้อจำกัดในการเลือกบล็อกของชุดข้อมูลสเปกตรัมสำหรับการคาลิเบรชั่นแบบ PLS การเลือกสามารถทำได้โดยการใช้อินเตอร์เฟอโรแกรม (Interferograms) สเปกตรัมแบบช่องสัญญาณเดียว (Single channel spectra) สเปกตรัมแบบส่องผ่าน (Transmission spectra) และอื่นๆ ในหลายๆกรณีแนะนำให้ใช้สเปกตรัมแบบดูดซับ (Absobance spectra) ตราบใดที่สามารถใช้กฎเบียร์-แลมเบิรต์ สเปกตรัมแบบดูดซับมีข้อดีที่สามารถแสดงความสัมพันธ์โดยตรงระหว่างค่าดูดซับกับความเข้มข้น ซึ่งความสัมพันธ์เชิงเส้นแบบนี้จะมีประโยชน์ต่อการคำนวณแฟคเตอร์ในขั้นตอนของ PLS (PLS–algorithm factorization)

H. การเลือกการพิสูจน์แบบภายในหรือภายนอก(Selecting Internal or External Validation)

แบบจำลองเคโมเมตริกสร้างขึ้นจากข้อมูลชุดคาลิเบรชั่น แล้วถูกทดสอบคุณภาพโดยใช้สเปกตรัมของชุดทดสอบ มีวิธีการพิสูจน์ 2 วิธี คือ การพิสูจน์ภายใน (Internal หรือ Cross validation) หรือ การพิสูจน์ภายนอก (External หรือ Test set validation)

การพิสูจน์แบบชุดทดสอบ (Test set validation) สำหรับการพิสูจน์แบบชุดทดสอบนั้นจะใช้กลุ่มตัวอย่างที่เป็นอิสระต่อกัน 2 กลุ่ม โดยกลุ่มแรกคือกลุ่มสำหรับการทำคาลิเบรชั่น (สร้างแบบจำลอง) ส่วนตัวอย่างที่เหลือ (กลุ่มที่2) ใช้สำหรับการพิสูจน์แบบจำลอง ทั้งสองกลุ่มควรจะประกอบด้วยจำนวนตัวอย่างที่ใกล้เคียงกัน และแต่ละกลุ่มควรจะครอบคลุมช่วงของความเข้มข้นของข้อมูลอย่างสม่ำเสมอ

การพิสูจน์แบบไขว้ (Cross Validation) ถ้ามีจำนวนตัวอย่างจำนวนจำกัด (50 ตัวอย่างหรือน้อยกว่า) ไม่ควรแยกชุดทดสอบ (Test set) การพิสูจน์แบบไขว้เท่านั้นที่สามารถทำการทำนายได้อย่างน่าเชื่อถือซึ่งเกี่ยวข้องกับคุณภาพของแบบจำลอง

ในทางปฏิบัติ จะทำการพิสูจน์แบบไขว้เป็นสิ่งแรกเพื่อประเมินวิธีการ โดยเฉพาะถ้ารับรองได้ว่าสเปกตรัมที่ได้ทำการวัดเป็นตัวแทนของตัวอย่าง การแยกกลุ่มทดสอบ (test set) ก็มีความสมเหตุสมผล ในทางตรงกันข้ามการพิสูจน์แบบชุดทดสอบมีข้อได้เปรียบเมื่อปริมาณข้อมูลมีจำนวนมาก ซึ่งใช้เวลาในการคำนวณน้อยกว่าการพิสูจน์แบบไขว้มาก

ซอฟแวร์ส่วนมากสามารถใช้ในการพิสูจน์ได้ทั้งภายในและภายนอก สิ่งนี้ช่วยให้นักวิเคราะห์ประเมินความครอบคลุม (Robustness) ของวิธีการ ซึ่งสามารถทำตามขั้นตอนดังนี้

ในขั้นตอนแรก (ได้อธิบายไว้ข้างต้น) แบบจำลองที่ดีที่สุดถูกหาโดยการพิสูจน์แบบไขว้ ได้ผลของค่า R² และ RMSECV ในขั้นตอนที่ 2 กลุ่มของข้อมูลถูกแยกเป็น 2 กลุ่มเท่าๆ กัน และกลุ่มแรกถูกกำหนดเป็นข้อมูลกลุ่มคาลิเบรชั่น และกลุ่มที่ 2 เป็นข้อมูลกลุ่มสำหรับทดสอบ แล้วสร้างแบบจำลอง (วิธีการ) โดยมีพารามิเตอร์ที่อธิบายก่อนหน้านี้ ซึ่งถูกพิสูจน์โดยกลุ่มสำหรับทดสอบ และถูกบันทึกค่า R² และ RMSEP ในขั้นตอนที่ 3 กลุ่มทดสอบและกลุ่มข้อมูลคาลิเบรชั่นถูกสับเปลี่ยน และตรวจสอบด้วยพารามิเตอร์ของแบบจำลองที่เหมือนกัน (การพิสูจน์แบบชุดทดสอบ ครั้งที่ 2) ผลของค่า R² และ RMSEP ถูกเปรียบเทียบกับการคำนวณที่เกิดขึ้นจากการพิสูจน์แบบชุดทดสอบ ครั้งที่ 1 และกับการพิสูจน์แบบไขว้ ตารางที่ 5.2 แสดงสิ่งนี้สำหรับความผิดพลาดของการวิเคราะห์

ตารางที่ 5.2 การตรวจสอบความเสถียรของแบบจำลองคาลิเบรชั่น

	Analysis Error of Cross Validation	Analysis Error of 1. Test Set Validation	Analysis Error of 2. Test Set Validation
Stable Calibration	0,10	0,11	0,10
Unstable Calibration	0,10	0,25	0,33

ในกรณีของข้อมูลที่มีขนาดเหมาะสมและเป็นตัวแทน (นี่เป็นสภาวะสำหรับวิธีการที่เสถียรแล้ว) ค่าทั้งหมดจะต้องมีอยู่ในช่วงความเผื่อความผิดพลาดที่น้อย ถ้าความผิดพลาดของการทำนายสำหรับการพิสูจน์แบบไขว้ (cross validation) ดีกว่าการพิสูจน์แบบชุดทดสอบ มันอาจเป็นตัวชี้วัดได้ว่าตัวอย่างที่ใช้ไม่เพียงพอ ผลจากความจริงที่ว่าสำหรับการพิสูจน์แบบไขว้ เมื่อเปรียบเทียบกับการพิสูจน์แบบชุดทดสอบ โดยประมาณ จะมีจำนวนตัวอย่าง 2 เท่าของตัวอย่างที่มีถูกรวมอยู่ในชุดคาลิเบรชั่น ถ้าจำนวนตัวอย่างไม่เพียงพอ มันจะมีผลอย่างยิ่งต่อการพิสูจน์แบบชุดทดสอบ เนื่องจากการลดจำนวนตัวอย่างของชุดคาลิเบรชั่น

ในทางตรงกันข้าม ถ้าชุดข้อมูลมีจำนวนมากเพียงพอ การแบ่งครึ่งจำนวนของชุดคาลิเบรชั่น ก็น่าจะทำให้เกิดความผิดพลาดของการวิเคราะห์คล้ายๆกัน ถ้าในกรณีนี้ สามารถสมมุติว่าการคาลิเบรชั่นจะครอบคลุมสภาวะในอนาคต นอกจากนี้ คำแนะนำโดยทั่วไปเพื่อหาวิธีการที่เหมาะสมทำโดยการพิสูจน์แบบชุดทดสอบครั้งที่ 1 แล้วตรวจสอบความครอบคลุมด้วยการพิสูจน์แบบไขว้และพิสูจน์ชุดทดสอบครั้งที่สอง ถ้ามีกลุ่มของชุดคาลิเบรชั่นและชุดทดสอบหลายกลุ่มขึ้น ก็จะง่ายขึ้นในการพิจารณาว่า การแบ่งครึ่งชุดข้อมูลนำไปสู่การสูญเสียอย่างมีนัยสำคัญของความแม่นยำ (Precision) ของการวิเคราะห์และการเพิ่มจำนวนตัวอย่างเป็นสิ่งจำเป็น

โดยไม่คำนึงถึงชนิดของการพิสูจน์ ต้องใส่ใจที่จะต้องไม่รวมตัวอย่างที่เหมือนกันในชุดคาลิเบรชั่นและในชุดทดสอบ เช่นเดียวกัน ถ้ามีการวัดตัวอย่างเดียวกันหลายครั้ง จะต้องไม่แยกสเปกตรัมเหล่านั้นออกไปในชุดข้อมูลทั้งสองชุด (ดูบทที่ 6: PLS-regression: วิธีที่ทำให้มีความถูกต้องไม่จำกัด)

I. การเลือกช่วงของสเปกตรัม (Selecting Spectral Ranges)

PLS regression เรียกได้ว่าเป็นวิธีการใช้สเปกตรัมทั้งหมดตลอดช่วง นั่นคือยิ่งมีจำนวนจุดข้อมูลสเปกตรัมมากขึ้น จะได้ข้อมูลเชิงสเปกตรัมต่อ 1 องค์ประกอบมากขึ้นและแบบจำลองจะยิ่งดีขึ้น อย่างไรก็ตามมันต้องพิจารณาว่าผลจากการรบกวนเชิงสเปกตรัมแถบของดูดซับขององค์ประกอบที่รบกวน สามารถทำให้คุณภาพของแบบจำลองลดลง ในกรณีเหล่านี้ อัลกอริธึมของ PLS ก็พยายามที่จะนำโครงสร้างของสเปกตรัมส่วนที่ไม่ได้มาจากองค์ประกอบที่ต้องการวิเคราะห์เข้ามาเกี่ยวข้อง และผลการวิเคราะห์จะด้อยลง ทั้งหมดนี้จะแสดงอยู่ในรูปที่ 5.6 เป็นตัวอย่างของสเปกตรัมเนียร์อินฟราเรดของน้ำ (การวัดแบบส่องผ่าน ระยะทางแสงผ่าน (optical path length): 2 mm) สเปกตรัมแสดงการดูดซับที่ระหว่าง 5,200 cm^-1ถึง 4,000 cm^-1 และที่น้อยกว่า 4,000 cm^-1 เป็นการถูกรบกวน (Noise) อย่างรุนแรง ขอบเขตทั้งสองนี้จะต้องไม่ถูกใช้เพื่อสร้างแบบจำลอง

รูปที่ 5.6 สเปกตรัมของน้ำในคิวเวต (ระยะทางแสงผ่าน (optical path length): 2 mm)

ดังนั้นจึงมักจะเป็นประโยชน์ในการวัดตัวอย่างทั้งหมดตลอดช่วงสเปกตรัม แล้วมองหาคุณสมบัติเชิงสเปกตรัมที่ช่วยพัฒนาแบบจำลอง ในบริบทนี้ แถบการดูดซับคลื่นที่มีค่าการดูดซับระหว่าง 0.7 และ 1.0 โดยทั่วไปนำไปสู่การได้ผลดีที่สุด เมื่อใช้ FT-spectrometers ที่ทันสมัย ปกติจะได้ค่าการดูดซับคลื่นสูงถึง 2.5 ซึ่งสามารถนำมาใช้คาลิเบรชั่นแต่ก็จำเป็นที่จะใช้ตัวตรวจวัด (Detector) ซึ่งทำงานเป็นเชิงเส้นตรงตลอดช่วงทั้งหมด (เช่น Peltier-cooled InAs- หรือ InGa-As detectors) สัญญาณขนาดใหญ่ (ค่าการดูดซับคลื่นสูงมากกว่า 2.5) ไม่ควรจะนำมาพิจารณา เนื่องจากจะนำไปสู่ความไม่แน่นอนของการวัดที่สูงขึ้น

อย่างไรก็ตามแนะนำให้ลบกลุ่มสัญญาณอย่างต่อเนื่อง โดยใน IR- NIR- และ Raman-สเปกโทรสโกปีนั้น สสารส่วนใหญ่ (สารที่ยกเว้นมีน้อยมาก) มีสัญญาณในช่วงสเปกตรัมที่กว้าง ดังนั้นการค้นหาโครงสร้างที่ให้ผลโดยปกติแล้วมักจะไม่จำเป็น ตารางที่ 5.3 และ รูปที่ 5.7 แสดงภาพคร่าวๆของช่วงความถี่ที่สังเกตได้ตามปกติในเนียร์อินฟราเรดสเปกโทรสโกปี (ข้อมูลรายละเอียดเพิ่มเติมจะหาได้ที่ภาคผนวก)

ตารางที่ 5.3 สัญญาณการดูดซับคลื่นเนียร์อินฟราเรด

J. การเลือกวิธีการจัดการข้อมูลเบื้องต้น(Selecting the Data Preprocessing Model Method)

นอกเหนือจากการเลือกความถี่ที่ถูกต้องแล้ว วิธีการจัดการข้อมูลเบื้องต้นเป็นพารามิเตอร์ของแบบจำลองที่สำคัญลำดับสอง ที่มีจุดประสงค์เพื่อสร้างแบบจำลองของสเปกตรัมในทางที่อัลกอริธึม PLS สามารถให้ความสัมพันธ์ที่ดีระหว่างสเปกตรัมกับข้อมูลความเข้มข้น

ไม่มีการจัดการข้อมูลเบื้องต้น: ไม่มีการจัดการข้อมูลเบื้องต้น
การลบโดยค่าคงที่ (Subtraction of a Constant Offset): สเปกตรัมจะถูกปรับแบบเชิงเส้นเพื่อให้ค่า Y ที่ต่ำสุดมีค่าเท่ากับศูนย์

การใช้งาน: เป็นการกำจัดปัญหาการขยับขึ้นของเบสไลน์ (Baseline Shift) เชิงเส้น สิ่งเหล่านี้เกิดจากเช่น จากค่าที่แตกต่างกันของการขยายสัญญาณของดีเทคเตอร์ (Detector Amplification)

การลบโดยเส้นตรง (Subtraction of a Straight Line): ในแต่ละช่วงความถี่ที่เลือกไว้ เส้นตรงเส้นหนึ่งจะถูกฟิตเส้นสเปกตรัมโดยใช้วิธีวิธี partial least squares (PLS) เส้นตรงเส้นนี้จะถูกลบออกจากสเปกตรัมดังกล่าว

การใช้งาน: กำจัดปัญหาความเอียงเชิงเส้นของการขยับขึ้นของเบสไลน์ (ดูรูปที่ 5.8)

Vector Normalization: ขั้นแรกสเปกตรัมจะถูกหาสเปกตรัมกลางจากนั้นผลรวมของค่ายกกำลังสองของค่า Y ทั้งหมดจะถูกคำนวณ และสเปกตรัมใดๆจะถูกหารด้วยค่ารากที่สองของผลรวมนี้ สิ่งที่เรียกว่า vector norm ของสเปกตรัมที่ได้จะเท่ากับ 1เสมอ (ดู Tips from experts: www.nirsresearch.com)

การใช้งาน: ในหลักการ สเปกตรัมจะประกอบด้วยสองส่วนของข้อมูล คือความสูงของแถบการดูดซับและโครงสร้าง หลังจากการนอร์มัลไลเซชั่น (Normalization) ข้อมูลความสูงจะหายไป; มีเพียงโครงสร้างข้อมูลยังคงอยู่ การนอร์มัลไลเซชั่น (Normalization) ถูกใช้เพื่อ เช่นการกำจัดผลกระทบของเส้นทางผ่านเชิงแสง (Optical Path Length) ที่แตกต่างกัน ในกรณีของการวัดแบบส่องผ่าน ความยาวของเส้นทางผ่านเชิงแสงทำให้ความสูงของสัญญาณเปลี่ยนแปลง แต่โครงสร้างยังเหมือนเดิม ในทำนองเดียวกันการวัดแบบสะท้อนแบบแพร่จะมีผลกระทบของการรบกวนเนื่องจากความหนาแน่นของวัสดุแตกต่างกันหรือขนาดอนุภาคแตกต่างกัน สิ่งเหล่านี้ก็จะลดลง

Min-Max-Normalization (สำหรับสเปกตรัมการดูดซับคลื่น): สเปกตรัมจะถูกขยับเชิงเส้นเพื่อให้ค่า Y ที่ต่ำสุดมีค่าเท่ากับศูนย์แล้วสเปกตรัมจะถูกขยายเพื่อให้ค่า Y สูงสุดเท่ากับสองหน่วยของการดูดซับคลื่น (รูปที่5.8)

การใช้งาน: เทียบได้กับ Vector Normalization

รูปที่ 5.8 NIR สเปกตรัมของมือคน; วัดแบบการสะท้อนแบบแพร่

Multiplicative Scatter Correction:ขั้นตอนแรก, สเปกตรัมเฉลี่ยคำนวณจากทุกๆสเปกตรัมของชุดข้อมูลคาลิเบรชั่น แล้วแต่ละสเปกตรัม X (i) จะถูกแปรเปลี่ยนไปตาม

X(i)'=u+v.X(i) (5-1)

ค่าสัมประสิทธิ์ u และ v จะถูกเลือกเพื่อให้มีความแตกต่างระหว่างสเปกตรัมที่เปลี่ยนแปลงแล้ว X(i)' กับสเปกตรัมเฉลี่ยน้อยที่สุด
การใช้งาน: วิธีการนี้มักจะใช้สำหรับการวัดแบบการสะท้อนแบบแพร่ (Diffuse reflection)

อนุพันธ์อันดับที่หนึ่ง (First Derivative):คำนวณอนุพันธ์ลำดับที่หนึ่งของสเปกตรัม (รูปที่ 5.8)

การใช้งาน: โดยการคำนวณอนุพันธ์ลำดับที่หนึ่ง สัญญาณที่มีความชันจะถูกเน้นมากกว่าสัญญาณที่ค่อนข้างแบนราบ วิธีนี้จะถูกใช้เน้นลักษณะที่ชัดเจน แต่มีค่าน้อย เมื่อเทียบกับโครงสร้างที่มีแถบการดูดซับคลื่นที่กว้าง การประยุกต์ใช้ที่สำคัญอีกอย่างหนึ่ง คือ การประเมินแถบการดูดซับคลื่นที่กว้างนี้มักจะทำในเทคโนโลยี NIR โดยการคำนวณอนุพันธ์ โครงสร้างเหล่านี้จะมีรูปร่างที่สูงชันขึ้น ซึ่งสามารถได้รับการประเมินได้ง่ายขึ้น

เมื่อใช้อนุพันธ์เป็นการจัดการข้อมูลเบื้องต้น จะต้องคำนึงถึงว่าสัญญาณรบกวนจะถูกจัดการเช่นกัน สิ่งนี้จะซ้อนทับบนสเปกตรัมเป็นสิ่งรบกวนเพิ่มเติม และสามารถทำให้สัญญาณของตัวอย่างเลวลง

อนุพันธ์ที่สอง (Second Derivative):คำนวณอนุพันธ์อันดับสองของสเปกตรัมนั้น

การใช้งาน: เมื่อเทียบกับอนุพันธ์อันดับที่หนึ่ง แม้โครงสร้างที่ราบเรียบมากๆสามารถประเมินได้ ผลการรบกวนของสัญญาณรบกวน ซึ่งโดยทั่วไปมีมากจนทำให้สเปกตรัมถูกวิเคราะห์ในช่วงสเปกตรัมที่จำกัดมากๆ

รูปที่ 5.8 แสดงให้เห็นอิทธิพลของวิธีการจัดการข้อมูลเบื้องต้นแบบต่างๆต่อลักษณะของ NIR-สเปกตรัม (การวัดมือคนด้วยหัววัดไฟเบอร์ออปติก) สเปกตรัมเดิมแสดงให้เห็นการขจัด (Offset) เล็กน้อยของเบสไลน์ เช่นเดียวกับการขยับขึ้น (Drift) การขยับขึ้นนี้สามารถถูกกำจัดโดยการลบออกจากเส้นตรง (Subtraction of a Straight Line) (เส้นประ) และการขจัดถูกกำจัดโดยการ Min-Max Normalization (เส้นจุด) อนุพันธ์อันดับที่หนึ่งของเส้นสเปกตรัมเดิม (เส้นประ-จุด) ถูกขยายเพื่อแสดงให้ดูง่ายและขยับขึ้นสู่ตำแหน่งที่ค่าการดูดซับคลื่นสูง สามารถสังเกตเห็นโครงสร้างที่แหลมขึ้นมาได้ชัดเจนเมื่อเปรียบเทียบกับสเปกตรัมเดิม

วิธีที่เหมาะสมที่สุดขึ้นอยู่กับระบบที่จะวิเคราะห์ จากประสบการณ์แสดงให้เห็นว่าในหลายกรณีการลบด้วยเส้นตรง การนอมัลไรเซชั่นสเปกตรัม หรือการทำอนุพันธ์อันดับที่หนึ่งได้ผลที่ดีที่สุดในการคาลิเบรชั่น ในบางกรณีการใช้วิธีการจัดการข้อมูลเบื้องต้น 2 วิธีรวมกันก็ได้ผลดีที่สุดเช่นกัน บ่อยครั้งที่แบบจำลองแบบต่างๆให้ผลได้ดีเท่าเทียมกัน (ดูบทที่ 6) ซึ่งโดยทั่วไปควรทดสอบดูหลายๆวิธีเปรียบเทียบกัน

K. การเลือกจำนวนแฟคเตอร์ที่เหมาะสม (Selecting the Appropriate Number of Factors)

ใน PLS regression ข้อมูลสเปกตรัมและข้อมูลความเข้มข้นจะถูกเปลี่ยนแปลงเป็นรูปแบบของเมทริกซ์และลดลงเป็นแฟคเตอร์จำนวนไม่มาก จำนวนแฟคเตอร์ ในแบบจำลองเคโมเมตริกจะถูกเรียกว่า “rank” การหาจำนวน rank มีความสำคัญกับคุณภาพในการวิเคราะห์

การเลือกจำนวนแฟคเตอร์ที่น้อยเกินไปจะนำไปสู่การอธิบายที่ไม่เพียงพอเกี่ยวกับการเปลี่ยนแปลงในข้อมูลสเปกตรัมและความเข้มข้น (“under fitting”) มีเพียงความสัมพันธ์เพียงเล็กน้อย ระหว่างสองชุดข้อมูลและผลจากการวิเคราะห์จากแบบจำลองนี้จะไม่เพียงพอ ถ้าเลือกแฟคเตอร์จำนวนมากเกินไปแบบจำลองจะพยายามที่จะคิดรวมแม้การเปลี่ยนแปลงน้อยที่สุดในชุดข้อมูลเช่นสัญญาณรบกวนในสเปกตรัม (“over fitting”) วิธีนี้ข้อมูลสเปกตรัมที่ไม่เกี่ยวข้องกับตัวอย่างจะถูกรวมอยู่ในแบบจำลอง แบบจำลองเหล่านี้จะมีความผิดพลาดของผลการวิเคราะห์ ดังนั้นทุกๆแบบจำลอง PLS มีจำนวนแฟคเตอร์ที่เหมาะสมซึ่งรับประกันว่ามีความผิดพลาดน้อยที่สุดที่เป็นไปได้ในการวิเคราะห์

มีแนวทางหลายอย่างที่นำไปสู่การหาจำนวนเฟคเตอร์ที่เหมาะสมสำหรับแบบจำลอง บางอย่างเป็นค่าเฉลี่ยของความผิดพลาดของการทำนาย (RMSECV ของการพิสูจน์แบบไขว้และ / หรือ RMSEP ของการพิสูจน์แบบชุดทดสอบ) ต้องมีค่าต่ำสุดจึงจะได้จำนวนแฟคเตอร์ที่เหมาะสม ในทางตรงข้ามค่าของสัมประสิทธิ์ของการพิจารณา R²มีค่าสูงสุด ดังนั้นจำนวนแฟคเตอร์ที่เหมาะสมสำหรับแบบจำลองสามารถหาได้อย่างง่ายดาย: ขั้นที่ 1 คำนวณค่า R² และค่าความผิดพลาดเฉลี่ยของการทำนาย จากนั้นพล็อตค่าเหล่านี้โดยให้แกนนอนเป็นจำนวนแฟคเตอร์ จำนวนแฟคเตอร์ที่เหมาะสมเมื่อมีค่าตามที่กล่าวมามีค่าที่เหมาะสม (น้อยสุด) และ / หรือจะไม่เปลี่ยนแปลงอย่างมีนัยสำคัญเมื่อมีจำนวนแฟคเตอร์สูงขึ้น ถ้ามีจำนวนแฟคเตอร์ที่มากและได้ผลการทำนายที่ดีเหมือนๆกับที่มีจำนวนแฟคเตอร์น้อย จะแนะนำให้เลือกแบบจำลองที่มีจำนวนแฟคเตอร์น้อยสุด (ดูบทที่ 6)

ข้อควรระวัง: การพิสูจน์วิธีการเป็นไปได้เฉพาะการใช้สเปกตรัมของชุดตัวอย่างที่เป็นอิสระนั่นคือสเปกตรัมต้องไม่เป็นส่วนหนึ่งของชุดข้อมูลคาลิเบรชั่น ซึ่งถ้าเป็นการพิสูจน์แบบไขว้ตัวอย่างทั้งหมดที่ถูกวัดแต่ละตัวอย่างจะถูกดึงออกจากชุดคาลิเบรชั่น “leave-out spectra” ในกรณีของการพิสูจน์แบบชุดทดสอบตัวอย่างใหม่จะถูกวัดเพื่อเป็นชุดทดสอบ

L. การเลือกตัวอย่างชุดคาลิเบรชั่นที่เหมาะสม; การระบุและการกำจัดค่าผิดปกติ (Selecting Suitable Calibration Samples; Recognizing and Eliminating Outliers)

ถ้าชุดข้อมูลคาลิเบรชั่นมีค่าผิดปกติ จะสามารถระบุได้อย่างง่ายหลังจากทำการพิสูจน์ ค่าผิดปกติจะแสดงโดย เช่น

มีส่วนที่ค่าความผิดพลาดเชิงสเปกตรัม (Spectral residuum) ที่มีค่าสูง
มีค่า F-value มาก
ค่า FProb เท่ากับ 0.99 หรือมากกว่า
ข้อผิดพลาดในการวิเคราะห์ค่อนข้างมาก ซึ่งสามารถเห็นได้จากค่าที่ต่างกันสูง (ค่านี้แสดงให้เห็นถึงความแตกต่างระหว่างค่าอ้างอิงและค่าการวิเคราะห์ (ด้วย NIRS))

ในกรณีส่วนใหญ่ มันจะเป็นประโยชน์ที่จะเปรียบเทียบค่าอ้างอิงกับค่าการวิเคราะห์โดยใช้กราฟ ค่าผิดปกติแสดงระยะห่างจากค่าอ้างอิงมาก หลังจากลบค่าผิดปกติจากชุดข้อมูลคาลิเบรชั่น แบบจำลองใหม่สามารถถูกสร้างขึ้นได้ การพิสูจน์ควรจะไม่มีค่าผิดปกติอีกต่อไป สำหรับชุดข้อมูลที่สำคัญ มันเป็นไปได้ว่าหลังจากที่กำจัดค่าผิดปกติชุดแรกแบบจำลองนี้ก็ยังไม่ดีที่สุด เป็นกรณีที่ถ้าจำนวนค่าผิดปกติสูงจนส่งผลกระทบต่อแบบจำลองอย่างเห็นได้ชัด ดังนั้น แบบจำลองจะต้องปรับให้เหมาะสม ทีละขั้นตอนโดยการกำจัดค่าความผิดปกติ

ข้อควรระวัง อย่างไรก็ตาม มันเป็นสิ่งจำเป็นที่จะตรวจสอบอย่างวิกฤติว่า ค่าผิดปกติเกิดจากการวัดที่ผิดพลาดหรือไม่ การกำจัดตัวอย่างที่ปกติ แต่ไม่ชอบ “เป็นสิ่งที่ทำไม่ได้” แบบจำลองคาลิเบรชั่นจะขาดความเสถียรที่เพียงพอ ที่จะจัดการความแตกต่างทางธรรมชาติของตัวอย่างต่างๆ

โดยปกติตัวอย่างจะถูกทำเครื่องหมายให้เป็นค่าผิดปกติ จะอยู่ไกลจากช่วงปกติของชุดคาลิเบรชั่น ในกรณีนี้ อย่างไรก็ตาม สาเหตุสำคัญในการระบุค่าผิดปกติไม่ใช่การวัดค่าผิดพลาด แต่เป็นการขาดความครอบคลุมสภาวะที่เป็นจริง (Robustness) จึงเป็นหน้าที่ของนักวิเคราะห์ในการสร้างการกระจายของค่าองค์ประกอบในช่วงทั้งหมดอย่างสม่ำเสมอ โดยการวัดตัวอย่างเพิ่มเติมแทนที่จะกำจัดค่าที่มีอยู่ไม่กี่ค่า และไม่ควรไว้ใจการระบุค่าผิดปกติในรายงานการพิสูจน์โดยไม่เข้าใจและกำจัดตัวอย่างที่ถูกระบุนั้นออกไปโดยง่าย โดยทั่วไปซอฟแวร์ทางเคโมเมทริกสามารถวัดความน่าเชื่อถือของค่า โดยมีพื้นฐานของค่าพารามิเตอร์ทางสถิติเท่านั้น จะเห็นได้อย่างชัดเจนว่า ถ้าเพียงแต่คิดค่าเหล่านี้โดยไม่มีความรู้ใดๆ เกี่ยวกับการประยุกต์ใช้ที่สอดคล้องกัน มันจะเป็นไปไม่ได้เลยที่จะตัดสินว่า สเปกตรัมนั้นๆ จะเป็นสเปกตรัมนอกกลุ่ม(ผิดปกติ) (Outlier) จริงๆ ดังนั้นเพียงผู้วิเคราะห์เท่านั้นจะสามารถตัดสินใจบนพื้นฐานของการพิจารณาสเปกตรัมนั้นอย่างเป็นอิสระ ว่าค่านี้ต้องปฏิเสธจริงๆหรือไม่สำหรับการประยุกต์ใช้งานเฉพาะ

M. การประเมินผลการพิสูจน์ (Evaluating the Validation Results)

งานที่สำคัญที่สุดอย่างหนึ่งของผู้พัฒนาแบบจำลอง คือ การพิจารณาความเป็นประโยชน์ของชุดข้อมูล วิธีที่ง่ายที่สุดที่จะพิสูจน์ความน่าเชื่อถือของชุดข้อมูล คือการวัดตัวอย่างต่างๆหลายๆครั้ง แล้วพล๊อตค่าจริงกับค่าทำนาย ในกรณีที่เป็นอุดมคติค่าวัดจริงและค่าทำนายของทุกๆการวัดจะเหมือนกันภายในพิกัดความผิดพลาดที่กำหนดไว้

อย่างไรก็ดี สิ่งนี้ไม่สามารถประยุกต์ใช้กับทุกๆแบบจำลองคาลิเบรชั่น ในบางกรณีค่าความผิดพลาดเฉลี่ยของการทำนาย (RMSECV หรือ RMSEP) อาจไม่มีคุณภาพตามต้องการ จึงเป็นหน้าที่ของผู้วิเคราะห์ที่จะหาคำอธิบายเกี่ยวกับผลที่ได้และที่จะหาวิธีการวัดที่เหมาะสม เพื่อที่จะปรับปรุงผล ถ้าเป็นไปไม่ได้ จำเป็นที่จะต้องตระหนักโดยเร็วว่า วิธีการที่เลือกไว้ไม่เหมาะสมกับการวิเคราะห์ตัวอย่างให้มีความแม่นยำเพียงพอ และ ดังนั้นจึงไม่สามารถที่จะทำอะไรต่อไปได้ซึ่งจะอธิบายโดยยกตัวอย่างต่อไปนี้ 2 ตัวอย่าง

รูปที่ 5.9 แสดงการเปรียบเทียบค่าจากการวัดจริงและค่าทำนายของ 2 แบบจำลองซึ่งมีความแม่นยำไม่ดีพอ

แต่ละตัวอย่างถูกวัด 3 ซ้ำ โดยทั่วไปแต่ละจุดมีระยะห่างจากเส้นกึ่งกลาง (Bisector) มาก อย่างไรก็ตามรูปในด้านซ้ายมือแสดงการวัดในแต่ละตัวอย่างมีความถูกต้องสูง แต่ละจุดของตัวอย่างแสดงระยะห่างจากเส้นตรงโดยประมาณที่เท่าๆ กัน อีกนัยหนึ่งกล่าวได้ว่า การวัดผิดพลาด (Wrong) แต่แม่นยำ (Precise) สิ่งเหล่านี้นำไปสู่การสรุปได้ว่า ขั้นตอนการวิเคราะห์ควรต้องเหมาะสมเพื่อแก้ไขการวัด สาเหตุสำหรับความบกพร่องของความไม่ถูกต้องอาจอยู่ที่ปัจจัยอื่นๆ

ยกตัวอย่างเช่นการกระจายทางสถิติของค่าที่ทำการวิเคราะห์เทียบกับค่าจริงเกิดจากการวัดด้วยวิธีอ้างอิงที่ไม่เที่ยงตรงหรือโดยการปลอมปนจากการเตรียมตัวอย่าง ในทางตรงกันข้าม การวัดที่อุณหภูมิแตกต่างหรือการใช้การตั้งค่าการวัดที่แตกต่างก็เป็นสาเหตุของความผิดพลาดที่เกิดขึ้นกับระบบ สิ่งเหล่านี้ทำให้แต่ละจุดโดยรวมจะอยู่เหนือและต่ำกว่าเส้นตรงในรูปที่ 5.9 นอกจากนั้นวิธีเคโมเมทริกซ์ที่ไม่สมบูรณ์สามารถนำไปสู่ผลเช่นนี้ ยกตัวอย่างเช่น สารประกอบที่มีองค์ประกอบที่หลากหลายและซับซ้อน ต้องการมาตรฐานการคาลิเบรชั่นที่เป็นตัวแทนจำนวนมาก ถ้าสิ่งนี้ไม่ถูกวัดในจำนวนที่เพียงพอ อัลกอริธึมก็ไม่สามารถที่จะกำหนดโครงสร้างเฉพาะของสารที่ต้องการวัดในสเปกตรัมอย่างเหมาะสมกับองค์ประกอบนั้น ดังนั้นการวิเคราะห์ตัวอย่างใหม่ที่ไม่ทราบค่าจะนำไปสู่ความแม่นยำแต่เป็นการวิเคราะห์ที่ผิด จึงต้องเพิ่มจำนวนสเปกตรัมให้มากขึ้นในการสร้างแบบจำลอง

ในหลายๆกรณี สาเหตุการได้ผลที่เลวของการวิเคราะห์สามารถพบเจอได้ง่าย ถ้าค่าการวัดในแต่ละครั้งจะแสดงได้อย่างแม่นยำพร้อมกับการวิเคราะห์ NIRS มันเป็นเรื่องที่วิกฤตมาก ถ้าจุดแต่ละจุดแสดงการกระจายของค่าทางสถิติที่กว้าง (รูปขวาของรูปที่ 5.9) ดังนั้นค่าที่ถูกคำนวณไม่เพียงแต่จะผิด แต่ไม่สามารถทำซ้ำได้ (not reproducible) โดยปกติการเตรียมตัวอย่างที่ไม่เหมาะสมจะได้รับผลที่ไม่ดี ตัวอย่างเช่น การวัดตัวอย่างที่หลากหลาย (heterogeneous sample) ถ้าวัสดุไม่เป็นเนื้อเดียวกัน หรือถ้าจุดที่วัดเล็กเกินไป ก็จะได้ค่าที่ไม่ถูกต้อง ถึงแม้จะวัดในจุดที่ถูกต้องก็ตาม นี่จะต้องพิจารณาในระหว่างการประเมินผล ถึงแม้ว่าถ้าค่าของการวัดไม่สามารถปรับปรุงให้เหมาะสมได้ มีข้อแนะนำให้เพิ่มจำนวนของตัวอย่างในการทำแบบจำลองคาลิเบรชั่น ถ้ายังไม่สามารถปรับปรุงความถูกต้องในการทำนายได้มากขึ้น ก็แสดงว่าวิธีที่วิเคราะห์ (NIRS) ที่เลือกนั้นไม่เหมาะสม

N. การนำแบบจำลองไปใช้และการบำรุงรักษา (Implementation and Maintenance of Methods)

แน่นอนว่าสิ่งที่สำคัญที่สุดของผู้พัฒนาวิธีการคือ การรวบรวมชุดข้อมูลคาลิเบรชั่นที่เป็นตัวแทน และการพิจารณาสิ่งรบกวนที่เป็นไปได้ต่อการวัดหรืออุปกรณ์ ซึ่งโดยปกติต้องมีความชำนาญในการวิเคราะห์ เนื่องจากไม่เพียงแต่ตัวอย่างเท่านั้นที่จะถูกตรวจสอบ (และหรือกระบวนการซึ่งสามารถตรวจสอบได้) ให้เข้าใจ แต่ยังจะต้องเข้าใจเทคนิคของการประเมินค่าและการวัดด้วย ดังนั้นทุกบริษัทจะต้องมีผู้ชำนาญในการรวบรวมและบำรุงรักษาแบบจำลอง ในหลายๆโรงงานจะต้องมีบริษัทจากภายนอกมานำเสนอบริการการคาลิเบรชั่นที่มีคุณภาพ นอกเหนือจากการคาลิเบรชั่นที่เกิดขึ้นจริง พวกเขาควรจะให้ค่าประเมินความถูกต้องที่คาดไว้ของแบบจำลองในบริบทเกี่ยวกับการศึกษาความเป็นไปได้ เช่นเดียวกันกับการบำรุงรักษาแบบจำลองอย่างเป็นระบบ ควรจะถูกนำเสนอ เช่น ตามข้อตกลงในการบริการ

โดยปกติมักจะแนะนำให้พิจารณาความน่าเชื่อถือของวิธีเคโมเมทริกเป็นระยะ ซึ่งสามารถทำอย่างง่ายๆโดยวัดความน่าเชื่อถือของแบบจำลองด้วยชุดตัวอย่างทดสอบอิสระเป็นระยะสม่ำเสมอ (เช่น ทุกๆกี่เดือน ทุกๆกี่รอบการผลิต หรือหลังจากการวัดกี่ครั้ง เป็นต้น) ในบางอุตสาหกรรม เช่นอุตสาหกรรมยา ข้อแนะนำขั้นตอนที่เหมาะสม ทำให้ผู้ใช้ต้องทำการตรวจสอบอย่างสม่ำเสมอ (ยาเม็ดหนึ่งจะสามารถถูกอนุญาตให้ขายได้ ถ้ามีใบรับรองผลการวิเคราะห์)

แต่แม้แต่ว่าถ้าไม่มีกฎเกณฑ์ที่เหมาะสม ก็ควรจะมีการสังเกตและบำรุงรักษาแบบจำลอง มันสามารถถูกสังเกตบ่อยๆว่าแม้ว่าแบบจำลองจะมีประโยชน์ในระยะแรก แต่จะค่อยๆให้ผลที่เลวลงทีละน้อย โดยมีเหตุผลหลายอย่าง อย่างแรกคือ การเปลี่ยนแปลงของเครื่องมือทีละเล็กทีละน้อย (และการเปลี่ยนแปลงของคิวเวต หัววัด และใยแก้วนำแสง) นอกจากนี้แล้วการเปลี่ยนสภาวะของบริเวณที่วัดหรือคุณภาพของวัตถุดิบที่แตกต่างก็มีผลต่อคุณภาพของการวิเคราะห์ โดยเฉพาะอย่างยิ่งการสร้างแบบจำลองของวัสดุที่เป็นทางธรรมชาติหรือวัตถุดิบทางปิโตรเคมี ทำให้การบำรุงรักษาวิธีการมีความจำเป็นในช่วงเวลานาน

สำหรับการประยุกต์ใช้งานต่างๆ มันมีความสำคัญว่าการลดคุณภาพของการวิเคราะห์อย่างช้าๆ ต้องถูกรับรู้ในระยะแรก ปัญหาใหม่ๆของการวิเคราะห์หรือเทคโนโลยีของกระบวนการจะไม่ยอมให้สามารถปรับปรุงแบบจำลอง เมื่อมันได้สูญเสียความเป็นประโยชน์สำหรับงานที่ได้รับ การบำรุงรักษาแบบจำลองควรเป็นกระบวนการต่อเนื่องในการวิเคราะห์ประจำวัน

ถ้าผู้พัฒนาแบบจำลองเชื่อว่ามีตัวอย่างชุดทดสอบจำนวนหนึ่งไม่ได้ถูกวิเคราะห์อย่างถูกต้อง ขั้นตอนแรกมันสำคัญที่จะทบทวนและเปรียบเทียบสเปกตรัมกับของชุดคาลิเบรชั่นในตอนแรก ส่วนมากเหตุผลสำหรับข้อมูลที่ผิดปกติ สามารถค้นพบได้อย่างรวดเร็ว เมื่อเหตุผลนั้นได้รับการเข้าใจแล้ว กลยุทธ์ที่เหมาะสมสามารถถูกพัฒนาขึ้นเพื่อเพิ่มจำนวนตัวอย่างด้วยตัวอย่างที่เหมาะสม มันควรจะระบุในที่นี้ว่ามันไม่มีเหตุผลที่จะเพิ่มสเปกตรัมใหม่ๆเข้าไปในชุดข้อมูลอย่างต่อเนื่อง โดยปราศจากการตรวจสอบมาก่อน สิ่งที่เป็นอันตรายคือ ข้อมูลเพื่อให้วิธีการมีเสถียรภาพไม่รวมอยู่ในตัวอย่างเหล่านี้ ซึ่งชุดข้อมูลขนาดใหญ่จะถูกสร้างขึ้นซึ่งเป็นกลุ่มที่ไม่ใช่ตัวแทน ปัญหาต่อไปที่เรามักจะพบในกระบวนการวิเคราะห์ก็คือความเป็นไปไม่ได้ที่จะเลียนแบบสภาวะของกระบวนการจริงในห้องปฏิบัติการ นอกจากนี้การนำตัวอย่างและวิเคราะห์ด้วยวิธีการอ้างอิงมักจะเป็นไปไม่ได้ หรือพูดอีกอย่างหนึ่งว่า มันเป็นไปไม่ได้ที่จะเก็บตัวอย่างชุดคาลิเบรชั่นที่เป็นตัวแทน ในที่นี้มันมักจะเป็นประโยชน์ที่จะเก็บตัวอย่างก่อนแล้วจึงสรุปผลสำหรับค่านั้นของกระบวนการจากผลของการวิเคราะห์ประจำ (Routine analysis) ที่กำหนดขึ้น ถ้าเป็นไปไม่ได้จะต้องมีความรู้เกี่ยวกับวิธีการที่จำกัดอย่างยิ่งซึ่งสามารถทำงานเป็นผู้ตรวจสอบกระบวนการที่จะระบุว่า “Process OK” หรือ “Process not OK” บางครั้งวิธีการที่ไม่ถาวรซึ่งจัดสร้างขึ้นในห้องปฏิบัติการจะต้องนำมาให้ซึ่งผลที่ไม่แม่นยำ แต่จะสะท้อนการดำเนินไปของปฏิกิริยาได้อย่างถูกต้อง การตัดสินใจของนักวิเคราะห์ที่มีคุณภาพเป็นสิ่งจำเป็นในการพิจารณาว่าถ้าวิธีการที่กำหนดไว้เหมาะสมกับความต้องการของกระบวนการ

[1] “The copyright is belong to Dr. Jörg-Peter Conzen”

30 กันยายน 2561

ผู้ชม 2470 ครั้ง