Machine Learning for Decision-Making Under Uncertainty: New Methodologies and Energy Applications

Guardado en:
Detalles Bibliográficos
Publicado en:PQDT - Global (2025)
Autor principal: Alcántara Mata, Antonio
Publicado:
ProQuest Dissertations & Theses
Materias:
Acceso en línea:Citation/Abstract
Full text outside of ProQuest
Etiquetas: Agregar Etiqueta
Sin Etiquetas, Sea el primero en etiquetar este registro!
Descripción
Resumen:In an era defined by digital transformation and the exponential growth of big data, industries are increasingly leveraging advanced computational tools to address complex challenges. The energy sector, in particular, has embraced machine learning and optimization techniques to enhance decision-making processes under uncertainty. These data-driven approaches utilize vast datasets and computational power to model, predict, and optimize systems more effectively than traditional methods. This thesis investigates the integration of machine learning into mathematical optimization frameworks, with a focus on constraint learning and surrogate modeling methodologies for addressing stochastic and complex problems in energy systems. By embedding predictive models directly into optimization processes, the proposed solutions aim to improve efficiency while effectively managing uncertainty. Traditionally, optimization under uncertainty has been addressed through frameworks such as stochastic optimization and robust optimization. Stochastic optimization incorporates randomness by modeling uncertain parameters as random variables with predefined probability distributions, supporting risk-neutral or risk-averse decision-making. Robust optimization, on the contrary, ensures feasibility in worst-case scenarios by defining uncertainty sets without relying on probabilistic assumptions. Although these classical approaches have been instrumental, they often adopt restrictive assumptions about uncertainty distributions and can become computationally prohibitive for large-scale problems. The emergence of data-driven optimization marks a paradigm shift, utilizing machine learning models to predict uncertain parameters and embed these predictions directly into optimization problems. We build on this transition by bridging classical frameworks with machine learning techniques to develop data-informed adaptive methodologies. A significant portion of this thesis focuses on addressing endogenous uncertainty, i.e., uncertainty arising from the relationship between decision variables and response variables that must be accounted for within the optimization problem. This is achieved through trained surrogate machine learning models, which fall under the broader field of constraint learning. Additionally, we explore the application of surrogate models in scenarios involving exogenous uncertainty, such as those encountered in classical stochastic optimization. The thesis contributes to several methodological advancements. It extends constraint learning frameworks by embedding quantile-based and distributional predictive models directly into optimization problems to approximate unknown constraints or objectives. These techniques are implemented using linear models, tree-based models, and neural networks with ReLU activation functions, ensuring computational tractability while maintaining predictive accuracy. Furthermore, it generalizes surrogate modeling approaches for two-stage stochastic optimization, enabling decision-makers to incorporate risk measures such as conditional value-at-risk into their analyses. These methodologies are applied to real-world energy challenges to demonstrate their practical utility in enhancing decision-making under uncertainty. The thesis begins by contextualizing the limitations of traditional optimization methods in uncertain environments while highlighting the strong potential of machine learning-based approaches in Chapter 1. It introduces the concept of constraint learning and surrogate modeling and establishes the primary objectives of the thesis. Chapter 2 explores how machine learning models can be embedded into optimization problems to approximate unknown constraints or objectives. It discusses embedding techniques for linear models, tree-based models, and neural networks with ReLU activation functions, while introducing strategies to ensure robustness through trust regions and ensemble embedding. Chapter 3 develops the first energy application, focusing on optimizing heliostat field aiming strategies in concentrating solar power tower plants. A neural network-based surrogate model is employed to balance energy capture and flux uniformity on the receiver while addressing thermal stress issues. Results based on a real plant demonstrate a significant reduction in thermal stress indicators while maintaining high energy capture efficiency. Chapter 4 extends constraint learning methodologies to uncertain environments by introducing chance constraint learning and distributional constraint learning approaches. Chance constraint learning employs quantile regression for probabilistic constraint satisfaction, while distributional constraint learning uses neural networks to model full response distributions for stochastic optimization problems. These innovations are applied in optimizing day-ahead market participation strategies for large energy producers by combining price response learning with distributional constraints to effectively handle market uncertainties in Chapter 5. Another methodological innovation involves a quantile neural network framework for risk-averse two-stage stochastic optimization in Chapter 6. This framework incorporates conditional value-at-risk measures into surrogate modeling, allowing us to obtain heuristic solutions that account for risk aversion. The final application implements this framework to optimize risk-averse operations in smart grids by addressing renewable generation uncertainty through surrogate modeling with quantile neural networks in Chapter 7. The thesis concludes in Chapter 8 by synthesizing its key findings and emphasizing its contributions to data-driven optimization under uncertainty. It discusses limitations such as computational complexity in large-scale applications and identifies future research directions, including exploring the relationship between predictive accuracy and prescriptive performance of machine learning models. By integrating machine learning with mathematical optimization frameworks, this work highlights the transformative prospects of data-driven approaches to enable more resilient and efficient decision-making systems in uncertain environments. En una era definida por la transformación digital y el crecimiento exponencial de la información, las industrias están aprovechando cada vez más las herramientas computacionales avanzadas para abordar problemas complejos. El sector energético, en particular, ha adoptado técnicas de aprendizaje automático y optimización para mejorar los procesos de toma de decisiones bajo incertidumbre. Estos enfoques basados en datos utilizan grandes conjuntos de información y potencia computacional para modelar, predecir y optimizar sistemas de manera más efectiva que los métodos tradicionales. Esta tesis investiga la integración del aprendizaje automático en marcos de optimización matemática, centrándose en metodologías de aprendizaje de restricciones y modelos subrogados para abordar problemas estocásticos y complejos en sistemas energéticos. Al incorporar modelos predictivos directamente en procesos de optimización, las soluciones propuestas buscan mejorar la eficiencia al tiempo que gestionan eficazmente la incertidumbre. Tradicionalmente, la optimización bajo incertidumbre se ha abordado mediante marcos como la optimización estocástica y la optimización robusta. La optimización estocástica incorpora aleatoriedad modelando parámetros inciertos como variables aleatorias con distribuciones probabilísticas predefinidas, apoyando decisiones neutrales o aversas al riesgo. La optimización robusta, por el contrario, garantiza factibilidad ante los peores escenarios mediante conjuntos de incertidumbre sin depender de supuestos probabilísticos. Aunque estos enfoques clásicos han sido fundamentales, suelen adoptar supuestos restrictivos sobre las distribuciones de incertidumbre y pueden volverse computacionalmente prohibitivos en problemas a gran escala. La aparición de la optimización basada en datos marca un cambio de paradigma al utilizar modelos de aprendizaje automático para predecir parámetros inciertos e incorporar estas predicciones directamente en problemas de optimización. Esta tesis profundiza esta transición al combinar marcos clásicos con técnicas de aprendizaje automático para desarrollar metodologías adaptativas e informadas por datos. Una parte importante de esta tesis se centra en abordar la incertidumbre endógena, es decir, aquella que surge debido a la relación entre variables de decisión y variables respuesta que deben considerarse dentro del problema de optimización. Esto se logra mediante modelos subrogados basados en aprendizaje automático, pertenecientes al campo más amplio del aprendizaje de restricciones. Además, se explora la aplicación de modelos subrogados en escenarios con incertidumbre exógena, como aquellos encontrados en la optimización estocástica clásica. La tesis aporta varios avances metodológicos. Extiende los marcos del aprendizaje de restricciones incorporando modelos predictivos basados en cuantiles y distribuciones directamente en problemas de optimización para aproximar restricciones u objetivos desconocidos. Estas técnicas se implementan mediante modelos lineales, modelos basados en árboles y redes neuronales con funciones de activación ReLU, asegurando viabilidad computacional al tiempo que mantienen precisión predictiva. Además, generaliza enfoques basados en modelos subrogados para la optimización estocástica en dos etapas, permitiendo a los responsables de tomar decisiones incorporar medidas de riesgo como el valor condicional en riesgo (CVaR). Estas metodologías se aplican a desafíos energéticos reales para demostrar su utilidad práctica mejorando las decisiones bajo incertidumbre. La tesis comienza contextualizando las limitaciones de los métodos tradicionales de optimización en entornos inciertos y destacando el potencial transformador del aprendizaje automático basado en datos (Capítulo 1). Introduce el concepto del aprendizaje de restricciones y modelado subrogado, además de establecer los objetivos principales del trabajo. El Capítulo 2 explora cómo los modelos de aprendizaje automático pueden integrarse en problemas de optimización para aproximar restricciones u objetivos desconocidos. Se discuten técnicas para incorporar modelos lineales, basados en árboles y redes neuronales con funciones ReLU, introduciendo estrategias para asegurar robustez mediante regiones de confianza (trust regions) e integración por conjuntos (ensemble embedding). El Capítulo 3 desarrolla una primera aplicación energética centrada en optimizar estrategias apuntado del campo heliostático en plantas solares termoeléctricas de tipo torre central. Se emplea un modelo subrogado basado en redes neuronales para equilibrar captura energética y uniformidad del flujo sobre el receptor mientras se reducen problemas derivados del estrés térmico. Los resultados obtenidos con datos reales muestran una reducción significativa en indicadores de estrés térmico manteniendo alta eficiencia energética. El Capítulo 4 extiende metodologías del aprendizaje de restricciones a entornos inciertos mediante enfoques como el aprendizaje basado en restricciones probabilísticas (chance constraint learning) y el aprendizaje basado en restricciones distribucionales (distributional constraint learning). El primero utiliza regresión cuantílica para satisfacer restricciones probabilísticas; el segundo emplea redes neuronales para modelar distribuciones completas ante problemas estocásticos. Estas innovaciones se aplican a estrategias óptimas para participación en el mercado diario por grandes productores energéticos combinando aprendizaje predictivo sobre precios con restricciones distribucionales para manejar eficazmente incertidumbres del mercado (Capítulo 5). Otra innovación metodológica implica un marco basado en redes neuronales cuantílicas para la optimización estocástica aversa al riesgo en dos etapas (Capítulo 6). La metodología incorpora medidas como el valor condicional en riesgo a través del modelado subrogado permitiendo obtener soluciones heurísticas que consideran la aversión al riesgo. La aplicación final implementa este marco para optimizar operaciones aversas al riesgo en smart grids, abordando la incertidumbre asociada a la generación renovable mediante modelado subrogado con redes neuronales cuantílicas (Capítulo 7). La tesis concluye sintetizando sus principales hallazgos y enfatizando sus contribuciones a la optimización basada en datos bajo incertidumbre (Capítulo 8). Discute limitaciones como complejidad computacional para aplicaciones a gran escala e identifica futuras líneas de investigación, incluyendo explorar la relación entre precisión predictiva y desempeño prescriptivo de los modelos subrogados. Al integrar aprendizaje automático con marcos matemáticos tradicionales, este trabajo resalta el potencial transformador que poseen los enfoques basados en datos para lograr sistemas más resilientes y eficientes ante entornos inciertos.
Fuente:ProQuest Dissertations & Theses Global