Publication: Integration of machine learning and optimization models for data-driven decisions: applications to lot sizing problem with random yield
Program
Industrial Engineering and Operational Management
KU-Authors
KU Authors
Co-Authors
Editor & Affiliation
Compiler & Affiliation
Translator
Other Contributor
Author
Advisor
YĆK Thesis ID
928992
Date on the IR
Date
Language
Type
Embargo Status
No
Journal Title
Journal ISSN
Volume Title
Alternative Title
Veri tabanlı karar alma iƧin bütünleÅik yapay ƶÄrenme ve eniyileme modelleri: olasılıksal üretim randımanı durumunda lot belirleme problemi uygulamaları.
Abstract
In recent years, significant advancements in data collection, analytical techniques, and data-driven methodologies have transformed the landscape of addressing complex decision-making and production planning challenges. Building on these innovations, this thesis introduces novel data-driven approaches to manage uncertainty and variability across diverse applications. The core focus of this research is to leverage big data in uncertain environments to derive effective decision-making rules for policymakers by integrating machine learning techniques with optimization methods. The thesis encompasses three primary studies: decision-making problems under uncertainty, a single-stage lot sizing problem, and a multi-period lot sizing problem with random yields. First, we address a challenge in decision-making and classification problems where actions must be taken prior to observing an uncertain event, and incorrect decisions result in asymmetric costs. We propose some novel methods that integrate machine learning and optimization techniques to derive decision rules from limited observations, particularly in scenarios where frequent features have a significant impact on outcomes. Our methods aim to minimize the costs associated with incorrect decisions in both binary and multi class classification problems. Experimental results using publicly available data sets show that our approaches significantly outperform traditional benchmarks, reducing costs by up to 95% with respect to naive benchmarks. Second, we investigate a data-driven lot sizing problem under random yield. Motivated by semi-conductor production, we focus on the case where the random yield rate of a manufacturing process depends on a large number of features that can be observed before the lot sizing decision is made. Similarly, demand may also be random and may depend on a number of features. The lot sizing problem in this setting is challenging because the optimal decision depends on a large number of observed features for which there is limited data. To address this challenge, we propose estimation and optimization methods that combine tools from machine learning with tools from stochastic optimization. Using a publicly available data set for semi-conductor yield data and an additional synthetic data set, we compare the performance of different estimation and optimization approaches. We show that there is significant value of taking feature information into account for cost minimization. We also find that the best method for this problem combines tools from estimation with theoretical optimization properties of the random yield inventory problem. Finally, we extend the single-period lot sizing problem to a multi-period setting. Given the realized variability in yields across periods, there are numerous potential scenarios by the end of the production horizon. The main objective is to develop a data-driven rule for determining optimal lot sizes under unknown yield distributions, unlike conventional approaches in the literature that assume known distributions. This rule aims to minimize the expected underage and overage costs at the end of the final period plus holding cost of intermediate periods and variable production cost while ensuring that total customer demand is met. This study advances the literature by introducing reinforcement learning to address the multi-period lot sizing problem with stochastic yields and unknown distribution for the first time. To assess the effectiveness of our approach, we compare results against established static and dynamic optimization methods. Our method provides a flexible and adaptive framework for decision-making in complex production systems characterized by stochastic yields.
Son yıllarda, veri toplama, analitik teknikler ve veri odaklı yƶntemlerdeki ƶnemli ilerlemeler, karmaÅık karar alma ve üretim planlama zorluklarını ele alma biƧimlerini dƶnüÅtürdü. Bu tez, bu yeniliklere dayanarak, ƧeÅitli uygulamalarda belirsizliÄi ve deÄiÅkenliÄi yƶnetmek iƧin yeni yaklaÅımlar sunmaktadır. Bu araÅtırmanın temel odaÄı, makine ƶÄrenimi tekniklerini, optimizasyon yƶntemleriyle entegre ederek, belirsiz ortamlarda büyük verileri kullanarak karar vericiler iƧin etkin karar alma kuralları türetmektir. Tez, üç temel ƧalıÅmayı kapsamaktadır: belirsizlik altındaki karar alma durumları, rassal randımanı olan üretim sistemleri iƧin tek dƶnemli lot (parti) boyutlandırma ve son olarak Ƨok dƶnemli lot boyutlandırma sorunu. İlk olarak, belirsiz bir olayı gƶzlemlemeden ƶnce eylemlerle ilgili kararların verilmesi gereken ve yanlıŠkararların asimetrik maliyetlerle sonuƧlandıÄı karar alma ve sınıflandırma problemi incelenmektedir. Ćzellikle sık gƶrülen ƶzelliklerin sonuƧlar üzerinde ƶnemli bir etkiye sahip olduÄu senaryolarda, sınırlı gƶzlemlerden karar kuralları türetmek iƧin makine ƶÄrenimi ve optimizasyon tekniklerini entegre eden dƶrt yeni yƶntem ƶnermekteyiz. Yƶntemlerimiz, hem ikili hem de Ƨok sınıflı sorunlarda yanlıŠkararlarla iliÅkili maliyetleri en aza indirmeyi amaƧlamaktadır. Kamuya aƧık veri kümelerini kullanan deneysel sonuƧlar, yaklaÅımlarımızın geleneksel kıyaslama ƶlçütlerinden ƶnemli ƶlçüde daha iyi performans gƶsterdiÄini ve maliyetleri \%95'e kadar azalttıÄını gƶstermektedir. İkinci olarak, rastgele verim (üretim randımanı) altında veri odaklı bir lot boyutlandırma sorununu araÅtırıyoruz. Yarı iletken üretimindeki randıman sorunlarında yola Ƨıkarak, bir üretim sürecinin rastgele verim oranının lot boyutlandırma kararı verilmeden ƶnce gƶzlemlenebilen Ƨok sayıda ƶzniteliÄe (feature) baÄlı olduÄu duruma odaklanıyoruz. Benzer Åekilde, talep de rastgele olabilir ve bir dizi ƶzniteliÄe baÄlı olabilir. Bu ortamda en iyi lot belirleme kararı, randıman oranının sınırlı veri bulunan Ƨok sayıda gƶzlemlenen ƶzniteliÄe baÄlı olması nedeniyle zorlaÅmaktadır. Bu zorluÄun üstesinden gelmek iƧin, makine ƶÄreniminden araƧları rassal optimizasyon yƶntemleriyle birleÅtiren tahmin ve optimizasyon yƶntemleri ƶnerilmektedir. Yarı iletken verim verileri iƧin kamuya aƧık bir veri kümesi ve ek bir sentetik veri kümesi kullanarak, farklı tahmin ve optimizasyon yaklaÅımlarının performans karÅılaÅtırması sunulmaktadır. Maliyet minimizasyonu iƧin ƶznitelik bilgilerinin dikkate alınmasının ƶnemli bir deÄeri olduÄunu gƶsteriyoruz. Ayrıca, bu sorun iƧin en etkin yƶntemin, tahmin araƧlarını rassal getirili envanter sorununun kuramsal optimizasyon ƶzellikleriyle birleÅtirmek olduÄunu gƶstermekteyiz. Son olarak, randıman belirsizliÄi olan tek dƶnemli lot boyutlandırma problemini, Ƨok dƶnemli duruma geniÅletiyoruz. Dƶnemler arasındaki randıman oranındaki deÄiÅkenlik gƶz ƶnüne alındıÄında, üretim ufkunun sonunda Ƨok sayıda olası senaryo bulunmaktadır. Ana amaƧ, literatürdeki bilinen olasılık daÄıtımları varsayan geleneksel yaklaÅımların aksine, bilinmeyen getiri daÄıtımları altında optimum lot boyutlarını belirlemek iƧin veri odaklı yƶntemler geliÅtirmektir. Bu yƶntemler, son dƶnemin sonunda beklenen eksik ve fazla maliyetleri artı ara dƶnemlerin stok tutma ve deÄiÅken üretim maliyetini en aza indirmeyi ve toplam müÅteri talebinin karÅılanmasını saÄlamayı amaƧlamaktadır. Bu ƧalıÅma, rassal randıman oranı ve bilinmeyen olasılık daÄılımları ile Ƨok dƶnemli lot boyutlandırma sorununu ilk kez ele almak iƧin pekiÅtirmeli ƶÄrenme yƶntemlerini de ƶnermekte ve sınamaktadır. YaklaÅımımızın etkinliÄini deÄerlendirmek iƧin sonuƧları yerleÅik statik ve dinamik optimizasyon yƶntemleriyle karÅılaÅtırıyoruz. Yƶntemimiz, rassal randıman oranlarına sahip üretim sistemlerinde karar alma iƧin esnek ve uyarlanabilir bir ƧerƧeve sunmaktadır.
Son yıllarda, veri toplama, analitik teknikler ve veri odaklı yƶntemlerdeki ƶnemli ilerlemeler, karmaÅık karar alma ve üretim planlama zorluklarını ele alma biƧimlerini dƶnüÅtürdü. Bu tez, bu yeniliklere dayanarak, ƧeÅitli uygulamalarda belirsizliÄi ve deÄiÅkenliÄi yƶnetmek iƧin yeni yaklaÅımlar sunmaktadır. Bu araÅtırmanın temel odaÄı, makine ƶÄrenimi tekniklerini, optimizasyon yƶntemleriyle entegre ederek, belirsiz ortamlarda büyük verileri kullanarak karar vericiler iƧin etkin karar alma kuralları türetmektir. Tez, üç temel ƧalıÅmayı kapsamaktadır: belirsizlik altındaki karar alma durumları, rassal randımanı olan üretim sistemleri iƧin tek dƶnemli lot (parti) boyutlandırma ve son olarak Ƨok dƶnemli lot boyutlandırma sorunu. İlk olarak, belirsiz bir olayı gƶzlemlemeden ƶnce eylemlerle ilgili kararların verilmesi gereken ve yanlıŠkararların asimetrik maliyetlerle sonuƧlandıÄı karar alma ve sınıflandırma problemi incelenmektedir. Ćzellikle sık gƶrülen ƶzelliklerin sonuƧlar üzerinde ƶnemli bir etkiye sahip olduÄu senaryolarda, sınırlı gƶzlemlerden karar kuralları türetmek iƧin makine ƶÄrenimi ve optimizasyon tekniklerini entegre eden dƶrt yeni yƶntem ƶnermekteyiz. Yƶntemlerimiz, hem ikili hem de Ƨok sınıflı sorunlarda yanlıŠkararlarla iliÅkili maliyetleri en aza indirmeyi amaƧlamaktadır. Kamuya aƧık veri kümelerini kullanan deneysel sonuƧlar, yaklaÅımlarımızın geleneksel kıyaslama ƶlçütlerinden ƶnemli ƶlçüde daha iyi performans gƶsterdiÄini ve maliyetleri \%95'e kadar azalttıÄını gƶstermektedir. İkinci olarak, rastgele verim (üretim randımanı) altında veri odaklı bir lot boyutlandırma sorununu araÅtırıyoruz. Yarı iletken üretimindeki randıman sorunlarında yola Ƨıkarak, bir üretim sürecinin rastgele verim oranının lot boyutlandırma kararı verilmeden ƶnce gƶzlemlenebilen Ƨok sayıda ƶzniteliÄe (feature) baÄlı olduÄu duruma odaklanıyoruz. Benzer Åekilde, talep de rastgele olabilir ve bir dizi ƶzniteliÄe baÄlı olabilir. Bu ortamda en iyi lot belirleme kararı, randıman oranının sınırlı veri bulunan Ƨok sayıda gƶzlemlenen ƶzniteliÄe baÄlı olması nedeniyle zorlaÅmaktadır. Bu zorluÄun üstesinden gelmek iƧin, makine ƶÄreniminden araƧları rassal optimizasyon yƶntemleriyle birleÅtiren tahmin ve optimizasyon yƶntemleri ƶnerilmektedir. Yarı iletken verim verileri iƧin kamuya aƧık bir veri kümesi ve ek bir sentetik veri kümesi kullanarak, farklı tahmin ve optimizasyon yaklaÅımlarının performans karÅılaÅtırması sunulmaktadır. Maliyet minimizasyonu iƧin ƶznitelik bilgilerinin dikkate alınmasının ƶnemli bir deÄeri olduÄunu gƶsteriyoruz. Ayrıca, bu sorun iƧin en etkin yƶntemin, tahmin araƧlarını rassal getirili envanter sorununun kuramsal optimizasyon ƶzellikleriyle birleÅtirmek olduÄunu gƶstermekteyiz. Son olarak, randıman belirsizliÄi olan tek dƶnemli lot boyutlandırma problemini, Ƨok dƶnemli duruma geniÅletiyoruz. Dƶnemler arasındaki randıman oranındaki deÄiÅkenlik gƶz ƶnüne alındıÄında, üretim ufkunun sonunda Ƨok sayıda olası senaryo bulunmaktadır. Ana amaƧ, literatürdeki bilinen olasılık daÄıtımları varsayan geleneksel yaklaÅımların aksine, bilinmeyen getiri daÄıtımları altında optimum lot boyutlarını belirlemek iƧin veri odaklı yƶntemler geliÅtirmektir. Bu yƶntemler, son dƶnemin sonunda beklenen eksik ve fazla maliyetleri artı ara dƶnemlerin stok tutma ve deÄiÅken üretim maliyetini en aza indirmeyi ve toplam müÅteri talebinin karÅılanmasını saÄlamayı amaƧlamaktadır. Bu ƧalıÅma, rassal randıman oranı ve bilinmeyen olasılık daÄılımları ile Ƨok dƶnemli lot boyutlandırma sorununu ilk kez ele almak iƧin pekiÅtirmeli ƶÄrenme yƶntemlerini de ƶnermekte ve sınamaktadır. YaklaÅımımızın etkinliÄini deÄerlendirmek iƧin sonuƧları yerleÅik statik ve dinamik optimizasyon yƶntemleriyle karÅılaÅtırıyoruz. Yƶntemimiz, rassal randıman oranlarına sahip üretim sistemlerinde karar alma iƧin esnek ve uyarlanabilir bir ƧerƧeve sunmaktadır.
Source
Publisher
KoƧ University
Subject
Generative programming (Computer science), Deep learning (Machine learning), Mathematical optimization
Citation
Has Part
Source
Book Series Title
Edition
DOI
item.page.datauri
Link
Rights
restrictedAccess
Copyrights Note
© All Rights Reserved. Accessible to Koç University Affiliated Users Only!
