133x
001974
2025-08-01

Ocena dokładności wyników przy zastosowaniu znormalizowanego średniego błędu kwadratowego zdefiniowanego w WTG-Merkblatt M3

Ten artykuł wprowadza znormalizowany średni błąd kwadratowy (𝑒2) jako ilościowe kryterium walidacji do porównania danych symulowanych i obserwowanych. Podkreśla mocne strony tej miary w kalibracji modeli oraz jej zastosowanie do małych zestawów danych. Ograniczenia związane z wrażliwością na wartości odstające są również krótko omówione.

Wprowadzenie

W modelowaniu obliczeniowym i symulacji, szczególnie w dziedzinie dynamiki płynów i analizy obciążenia wiatrem, istotne jest ilościowe ocenianie dokładności wyników numerycznych w porównaniu z danymi referencyjnymi. Podczas gdy metody oceny trafności oferują binarną ocenę opartą na zdefiniowanych progach tolerancji, mogą one pomijać ogólny rozkład i wielkość odchyleń. Aby temu zaradzić, znormalizowany średni błąd kwadratowy e2 zapewnia uzupełniające podejście dostarczając ciągłej, niezależnej od skali miary wydajności modelu, jak wspomniano w Sekcji 5.3.2 WTG-Merkblatt M3. Ten artykuł analizuje definicję, zalety i ograniczenia używania e2 jako kryterium walidacji.

Definicja Znormalizowanego Średniego Błędu Kwadratowego

W kontekście walidacji danych symulowanych względem pomiarów referencyjnych, jedną z alternatyw dla analizy trafności jest obliczenie znormalizowanego średniego błędu kwadratowego, oznaczanego jako e2. To podejście oferuje bardziej ciągłą i ilościową miarę odchylenia między przewidywanymi wartościami Pi a obserwowanymi wartościami Oi. Wzór jest zdefiniowany jako:

To wyrażenie oparte na stosunku ocenia odchylenia kwadratowe znormalizowane przez wielkość obserwowanych wartości. Dostarcza bezwymiarowej miary błędu, która umożliwia lepszą porównywalność między zbiorami danych o różnych skalach.

Zalety e2 w Oceny Modelu

  • Kalibracja Modelu: Znormalizowany średni błąd kwadratowy może być bezpośrednio powiązany z współczynnikiem modelu, co czyni go użytecznym w zadaniach kalibracyjnych.
  • Stosowalność do Małych Zbiorów Danych: W przeciwieństwie do metod trafności, które wymagają statystycznie dużych zbiorów danych, e2 może być znacząco stosowany nawet przy mniejszych próbkach.
  • Precyzja Ilościowa: Wartość e2≤0.01 jest uważana za dobrą miarę dokładności symulacji, wskazując, że tylko 1% całkowitej energii w sygnale obserwowanym nie jest uchwycony przez model.

Ograniczenia

Jedną z wad metody e2 jest jej wrażliwość na odstające wartości. Zasadnicze indywidualne odchylenia mogą nieproporcjonalnie zwiększać błąd, nawet jeśli większość wartości jest dobrze przewidziana. Dlatego w krytycznych zastosowaniach zaleca się uzupełnienie tej miary kryteriami trafności opartymi na progach, aby zapewnić bardziej odporną walidację.

Przykład: Ocena Znormalizowanego Średniego Błędu Kwadratowego (𝑒2) dla 12 Punktów Pomiarowych na Powierzchni

Rozważmy 12 punktów pomiarowych z wartościami referencyjnymi Oi oraz odpowiadającymi im wartościami symulacyjnymi Pi:

Tabela 1: Informacje o 12 Punktach Pomiarowych

Punkt (i) Wartość Referencyjna (Oi) Wartość Symulacyjna (Pi)
1 0.72 0.75
2 0.68 0.70
3 0.81 0.85
4 0.77 0.73
5 0.66 0.69
6 0.74 0.71
7 0.85 0.80
8 0.70 0.66
9 0.81 0.88
10 0.76 0.69
11 0.82 0.75
12 0.69 0.80

Możemy więc obliczyć e2 za pomocą następującego wzoru:

Znormalizowany Średni Błąd Kwadratowy: 𝑒2=0.0055

Spełnia minimalne wymagania (e2≤0.01) dla walidacji wartości średnich.

Wniosek

Miara 𝑒2 jest potężnym narzędziem do oceny ogólnej dokładności modeli symulacyjnych, szczególnie w ocenie współczynników ciśnienia lub siły w badaniach walidacyjnych CFD. Przy odpowiednim użyciu, dostarcza niezawodnej podstawy ilościowej dla weryfikacji wydajności modelu i może uzupełniać kryteria kategoryczne takie jak analiza trafności dla bardziej kompleksowej oceny jakości.


Autor

Pan Kazemian jest odpowiedzialny za rozwój i marketing produktu Dlubal Software, w szczególności programu RWIND 2.



;