Księga abstraktów
VI Kongresu Statystyki Polskiej (Warszawa 1-2 lipca 2026 r.)Szóstego Kongresu Statystyki Polskiej (Warszawa 1-2 lipca 2026 r.)
-
Cel
Celem artykułu jest oszacowanie kosztów przemocy domowej w Polsce z perspektywy jednostkowej i systemowej oraz identyfikacja ograniczeń danych i kierunków dalszych badań. Badanie wypełnia lukę poznawczą wynikającą z braku kompleksowych analiz kosztów przemocy w krajach Europy Środkowo-Wschodniej, w szczególności w warunkach ograniczonej dostępności danych rejestrowych. Dotychczasowe badania koncentrują się jednak głównie na krajach anglosaskich.
Metody
Zastosowano podejście mieszane, łączące analizę makroekonomiczną (top-down) oraz mikroekonomiczną (bottom-up), co umożliwiło uchwycenie zarówno systemowego, jak i indywidualnego wymiaru kosztów przemocy domowej. W części makro wykorzystano dane pochodzące z kluczowych instytucji publicznych, w tym systemu ochrony zdrowia, wymiaru sprawiedliwości oraz pomocy społecznej, uzupełnione o źródła wtórne, co pozwoliło na oszacowanie kosztów na poziomie zagregowanym. Część mikro obejmowała próbę oszacowania kosztów przemocy domowej w przebiegu życia osób jej doznających w Polsce, ze szczególnym uwzględnieniem czasu trwania przemocy. Ze względu na ograniczony dostęp do odpowiednio licznej próby zastosowano podejście pośrednie – kwestionariusze wypełniali specjaliści pracujący z osobami doznającymi przemocy. We współpracy z Niebieską Linią IPZ zidentyfikowano typowe trajektorie przemocy (np. kobieta w średnim wieku, młoda osoba, senior, nastolatek, osoba z niepełnosprawnością), a następnie opracowano narzędzie do zbierania danych o przebiegu i konsekwencjach przemocy, które posłużyło do zebrania danych pilotażowych do wstępnego oszacowania kosztów dla różnych wariantów intensywności i czasu trwania przemocy.
Wyniki
Wyniki wskazują, że przemoc domowa generuje bardzo wysokie koszty zarówno dla osób jej doświadczających, jak i dla sektora publicznego. W analizowanym modelu kobiety w średnim wieku (z dziećmi lub bez) koszty w krótkim okresie (2 lata) wahają się od ok. 16,8 tys. zł w wariancie niskiej intensywności do ok. 188 tys. zł w wariancie wysokiej intensywności przemocy. Największe obciążenia wynikają z kosztów zdrowotnych, mieszkaniowych, utraty dochodów oraz interwencji systemu wymiaru sprawiedliwości. Koszty rosną znacząco wraz z wydłużeniem czasu trwania przemocy i nasileniem jej skutków, a ich konsekwencje mają charakter długookresowy, często obejmujący całe życie osób dotkniętych przemocą. Analiza ujawniła jednocześnie istotne luki w systemie gromadzenia danych, w tym brak spójnych definicji
Wnioski
Wnioski wskazują, że przemoc domowa stanowi nie tylko poważny problem społeczny, lecz także istotne obciążenie ekonomiczne. Wczesna interwencja i skuteczna profilaktyka mogą znacząco ograniczyć koszty długookresowe, co uzasadnia traktowanie działań przeciwdziałających przemocy jako inwestycji społeczno-ekonomicznej. Jednocześnie konieczne jest rozwijanie metod szacowania kosztów oraz budowa spójnego systemu danych umożliwiającego prowadzenie pogłębionych analiz i projektowanie efektywnych polityk publicznych.
Słowa kluczowe:
przemoc domowa, analizy kosztowe, metoda rachunkowości
Pobierz prezentację (docx, 15 kB)Objective
The aim of this article is to estimate the costs of domestic violence in Poland from both an individual and a systemic perspective, as well as to identify data limitations and directions for further research. The study fills a knowledge gap resulting from the lack of comprehensive analyses of the costs of violence in Central and Eastern European countries, particularly given the limited availability of registered data. However, existing research has primarily focused on Anglo-Saxon countries.
Methods
A mixed-method approach was applied, combining macroeconomic (top-down) and microeconomic (bottom-up) analyses, which made it possible to capture both the systemic and individual dimensions of the costs of domestic violence. In the macro component, data from key public institutions were used, including the healthcare system, the justice system, and social assistance, supplemented with secondary sources, enabling cost estimation at an aggregated level. The micro component involved an attempt to estimate the lifetime costs of domestic violence experienced by individuals in Poland, with particular emphasis on the duration of violence. Due to limited access to a sufficiently large sample, an indirect approach was adopted—questionnaires were completed by professionals working with victims of domestic violence. In cooperation with the Blue Line IPZ, typical violence trajectories were identified (e.g., a middle-aged woman, a young person, an older person, a teenager, a person with disabilities). Subsequently, a tool for collecting data on the course and consequences of violence was developed, which was used to gather pilot data for the preliminary estimation of costs across different levels of intensity and duration of violence.
Results
The results indicate that domestic violence generates very high costs for both those experiencing it and the public sector. In the analyzed model, for middle-aged women (with or without children), short-term costs (over 2 years) range from approximately 16,800 PLN in the low-intensity scenario to approximately 188,000 PLN in the high-intensity scenario. The greatest burdens stem from healthcare costs, housing costs, loss of income, and interventions by the justice system. Costs rise significantly as the duration of violence increases and its effects intensify, and their consequences are long-term, often spanning the entire lives of those affected by violence.
Conclusions
The analysis also revealed significant gaps in the data collection system, including a lack of consistent definitions, an underestimation of the number of people experiencing violence, and a lack of information on the costs incurred by institutions. This limits the ability to fully and systematically assess the scale of the phenomenon and its economic consequences. The findings indicate that domestic violence is not only a serious social problem but also a significant economic burden. Early intervention and effective prevention can significantly reduce long-term costs, which justifies treating anti-violence measures as a socio-economic investment. At the same time, it is necessary to develop
Keywords
domestic violence, cost estimation, accounting method
Cel
Celem referatu jest klasyfikacja rynków pracy w przekroju powiatów w Polsce z wykorzystaniem wielowymiarowej funkcjonalnej analizy głównych składowych (MFPCA) oraz identyfikacja zmiennych determinujących przynależność do skupień metodą lasu losowego (ang. Random Forest - RF). Podejście funkcjonalne pozwala uchwycić ciągłość czasową zmiennych, dając szerszą perspektywę analityczną niż klasyczne metody bazujące na obserwacjach punktowych. Implementacja metod RF daje możliwość oceny, które zmienne funkcjonalne w największym stopniu kształtują uzyskane skupienia.
Metody
Badaniem objęto wszystkie 380 powiatów. Dane pochodzą z Banku Danych Lokalnych GUS i dotyczą 20 zmiennych charakteryzujących lokalne rynki pracy (m.in. stopa bezrobocia, wskaźnik aktywności zawodowej, wskaźnik zatrudnienia, wynagrodzenia) za lata 2005-2024 (dane roczne). Zmienne poddano wygładzaniu funkcjonalnemu z wykorzystaniem bazy funkcji sklejanych (B-spline), uzyskując dla każdego powiatu reprezentację w postaci zestawu funkcji ciągłych. Klasyfikacji dokonano w dwóch krokach. W pierwszym zastosowano wielowymiarową funkcjonalną analizę składowych głównych (MFPCA), która redukuje przestrzeń wielowymiarowych danych funkcjonalnych do skończonego zbioru współrzędnych w przestrzeni głównych składowych. W drugim kroku na wyznaczonej macierzy współrzędnych przeprowadzono hierarchiczną analizę skupień metodą Warda z odległością euklidesową, wyodrębniając pięć skupień w rozumieniu powiatowych rynków pracy. Następnie w celu interpretacji uzyskanych skupień zastosowano las losowy (RF) uczony na etykietach klas przy wykorzystaniu współczynników bazy funkcyjnej poszczególnych zmiennych. Zastosowanie grupowej miary ważności zmiennych (ang. Grouped Variable Importance, GVI) pozwala ocenić wkład każdej zmiennej funkcjonalnej w kształtowanie podziału, przy zachowaniu separacji zmiennych wynikającej z zastosowanej funkcjonalnej reprezentacji danych.
Wyniki
Zastosowanie MFPCA pozwoliło na redukcję wymiaru przy zachowaniu dominującej części zmienności zawartej w danych. Analiza skupień metodą Warda na wyznaczonej macierzy współrzędnych głównych składowych umożliwiła wyodrębnienie pięciu klas powiatów, charakteryzujących się odmiennymi wielowymiarowymi trajektoriami zmiennych rynku pracy. Uzyskane skupienia odpowiadają rozpoznawalnym wzorcom regionalnego zróżnicowania rynku pracy w Polsce, obejmującym m.in. powiaty z wysokim bezrobociem, powiaty metropolitalne, powiaty peryferyjne oraz powiaty o charakterze rolniczym. Analiza grupowej ważności zmiennych (GVI) wykazała zróżnicowany wkład poszczególnych zmiennych funkcjonalnych w kształtowanie podziału, największe znaczenie klasyfikacyjne przypisano zmiennym związanym z poziomem bezrobocia.
Wnioski
Połączenie MFPCA, hierarchicznej analizy skupień i RF z grupową miarą ważności zmiennych tworzy spójne narzędzie klasyfikacji i interpretacji lokalnych rynków pracy. Funkcjonalne ujęcie danych pozwala uwzględnić zarówno poziom, jak i dynamikę zmiennych w całym analizowanym okresie. Uzyskane wyniki mogą służyć jako podstawa różnicowania regionalnych polityk kształtujących rynki pracy. Zaproponowane podejście jest transferowalne na inne obszary analiz regionalnych, w których dane mają charakter wielowymiarowych szeregów czasowych.
Słowa kluczowe:
wielowymiarowa funkcjonalna analiza głównych składowych (MFPCA), klasyfikacja regionalna, lokalne rynki pracy, las losowy, funkcjonalna analiza danych (FDA)
Pobierz prezentację (docx, 22 kB)Objective
The aim of this presentation is to classify labour markets at the level of Polish counties (powiats) using Multivariate Functional Principal Component Analysis (MFPCA) and to identify the variables determining cluster membership by means of the Random Forest (RF) method. The functional approach makes it possible to capture the temporal continuity of variables, providing a broader analytical perspective than classical methods based on pointwise observations. The implementation of RF methods enables an assessment of which functional variables shape the resulting clusters to the greatest extent.
Methods
The study covered all 380 counties (powiats). The data come from the Local Data Bank of Statistics Poland (BDL GUS) and pertain to 20 variables characterising local labour markets (including, among others, the unemployment rate, the labour force participation rate, the employment rate, and wages) for the years 2005-2024 (annual data). The variables were subjected to functional smoothing using a B-spline basis, yielding for each county a representation in the form of a set of continuous functions. The classification was performed in two steps. In the first step, Multivariate Functional Principal Component Analysis (MFPCA) was applied, reducing the space of multivariate functional data to a finite set of coordinates in the principal component space. In the second step, hierarchical cluster analysis was carried out on the resulting matrix of coordinates using Ward`s method with Euclidean distance, distinguishing five clusters understood as types of county labour markets. Subsequently, in order to interpret the obtained clusters, a Random Forest (RF) was trained on the class labels using the functional basis coefficients of the individual variables. The use of the Grouped Variable Importance (GVI) measure makes it possible to assess the contribution of each functional variable to the formation of the partition, while preserving the separation of variables resulting from the functional representation of the data.
Results
MFPCA enabled dimension reduction while preserving the dominant part of the variability contained in the data. Ward`s hierarchical clustering on the matrix of principal component coordinates distinguished five classes of counties, characterised by different multivariate trajectories of labour market variables. The obtained clusters correspond to recognisable patterns of regional differentiation of the labour market in Poland, including high-unemployment, metropolitan, peripheral, and agricultural counties. The Grouped Variable Importance (GVI) analysis revealed a differentiated contribution of individual functional variables to the partition, with the greatest classificatory significance attributed to unemployment.
Conclusions
The combination of MFPCA, hierarchical cluster analysis, and RF with the grouped variable importance measure constitutes a coherent tool for the classification and interpretation of local labour markets. The functional treatment of the data makes it possible to take into account both the level and the dynamics of the variables over the entire analysed period. The obtained results may serve as a basis for differentiating regional policies shaping labour markets. The proposed approach is transferable to other areas of regional analysis in which the data have the character of multivariate time series.
Keywords
multivariate functional principal component analysis (MFPCA), regional classification, local labour markets, random forest, functional data analysis (FDA)
Cel
Zmianom demograficznym towarzyszą głębokie przeobrażenia struktur rodzinnych i społecznych. Spadek dzietności oraz opóźnianie urodzenia pierwszego dziecka wpływają na sytuację rodzinno społeczną osób starszych, w tym na moment zostania babcią lub dziadkiem oraz liczbę wnuków. Procesom tym towarzyszą przemiany społeczno-kulturowe kształtujące postrzeganie roli dziadków. Celem referatu jest przedstawienie wyników analiz poświęconych zbiorowości dziadków i babć w Polsce, z uwzględnieniem ich sytuacji społeczno-demograficznej, sprawowania opieki nad wnukami oraz jakości życia tej grupy.
Metody
W referacie wykorzystano dane z dziewiątej fali Badania Zdrowia, Starzenia się Populacji i Procesów Emerytalnych (Survey of Health, Ageing and Retirement in Europe - SHARE), zrealizowanej w latach 2021–2022. Analizą objęto osoby w wieku 50 lat i więcej posiadające wnuki. Celem badania jest identyfikacja związku pomiędzy sprawowaniem opieki nad wnukami a subiektywną jakością życia dziadków i babć w Polsce. Analiza ma charakter dwuetapowy. W pierwszym etapie przedstawiono charakterystykę społeczno demograficzną badanej zbiorowości, ze szczególnym uwzględnieniem liczby wnuków i faktu zaangażowania w opiekę nad nimi. W drugim etapie przeanalizowano zależność między sprawowaniem opieki a subiektywną jakością życia mierzoną wskaźnikiem CASP 12, który odzwierciedla dobrostan jednostki w kluczowych obszarach funkcjonowania, takich jak kontrola, autonomia, samorealizacja i przyjemność. Wskaźnik ten przyjmuje wartości od 12 do 48, przy czym wyższe wartości oznaczają wyższy poziom jakości życia. Ze względu na ciągły charakter zmiennej zależnej zastosowano modele regresji liniowej. W analizach uwzględniono cechy demograficzne, zdrowotne oraz społeczno ekonomiczne respondentów, w tym m.in. wiek, płeć, poziom wykształcenia, subiektywną ocenę stanu zdrowia i sytuacji finansowej, symptomy depresji oraz liczbę wnuków. Modele oszacowano zarówno dla całej próby, jak i oddzielnie dla kobiet i mężczyzn. Ostateczna próba analityczna obejmowała ponad 4400 obserwacji.
Wyniki
Uzyskane wyniki wskazują, że niemal 80% osób w wieku 50 lat i więcej w Polsce posiadało przynajmniej jednego wnuka, przy czym odsetek ten był nieco wyższy wśród kobiet i wzrastał wraz z wiekiem. Niemal co trzecia osoba starsza sprawowała opiekę nad wnukami, częściej kobiety niż mężczyźni. Udział osób zaangażowanych w opiekę był wyższy w młodszych grupach wieku starszego niż wśród osób sędziwych. Wyniki modeli regresji wykazały, że sam fakt posiadania wnuków nie był istotnie związany z jakością życia kobiet, natomiast u mężczyzn zależność ta miała charakter pozytywny. Jednocześnie sprawowanie opieki nad wnukami było pozytywnie powiązane z jakością życia zarówno babć, jak i dziadków.
Wnioski
Zaprezentowana analiza struktury społeczno-demograficznej osób posiadających wnuki w Polsce wpisuje się w debatę nad przemianami struktur rodzinnych. Uzyskane wyniki pokazują, że relacje międzypokoleniowe, a w szczególności aktywne sprawowanie opieki nad wnukami, mają istotne znaczenie dla jakości życia osób starszych. Rezultaty dostarczają ważnych przesłanek dla polityki rodzinnej, senioralnej oraz rynku pracy, wskazując na potrzebę uwzględniania roli dziadków w rozwiązaniach wspierających opiekę nad dziećmi, przy jednoczesnym uwzględnieniu kontekstu społeczno-kulturowego, w którym opieka ta bywa postrzegana jako obowiązek, potencjalnie obniżający dobrostan osób starszych.
Słowa kluczowe:
SHARE, dziadkowie i babcie, sprawowanie opieki nad wnukami, jakość życia
Pobierz prezentację (docx, 18 kB)Objective
Demographic changes are accompanied by profound transformations in family and social structures. Declining fertility and the postponement of first births affect the family and social situation of older adults, in terms of timing of becoming grandparents and the number of grandchildren. These processes are further shaped by socio cultural changes influencing perceptions of the grandparental role. The aim of this paper is to present analyses of grandparents in Poland, focusing on their socio demographic characteristics, involvement in grandchild care, and quality of life.
Methods
The study uses data from the ninth wave of the Survey of Health, Ageing and Retirement in Europe (SHARE), conducted in 2021–2022. The analysis includes individuals aged 50 and over who have at least one grandchild. The main objective is to identify the relationship between providing care for grandchildren and grandparents’ subjective quality of life in Poland. The analysis is conducted in two stages. First, the socio demographic characteristics of the study population are described, with particular attention to the number of grandchildren and involvement in their care. Second, the association between caregiving and subjective quality of life is examined using the CASP 12 index, which reflects individual well being across key domains such as control, autonomy, self realization, and pleasure. The index ranges from 12 to 48, with higher scores indicating better quality of life. Due to the continuous nature of the dependent variable, linear regression models were applied. The analyses controlled for demographic, health, and socio economic characteristics, including age, gender, educational attainment, self rated health, financial situation, depressive symptoms, and number of grandchildren. Models were estimated for the total sample as well as separately for women and men. The final analytical sample comprised over 4,400 observations.
Results
The results indicate that nearly 80% of individuals aged 50 and over in Poland had at least one grandchild, with a slightly higher proportion among women and an increasing prevalence with age. Nearly one in three older adults provided care for their grandchildren, more often women than men. Involvement in grandchild care was more common among younger older adults than among the oldest old. Regression analyses showed that the mere fact of having grandchildren was not significantly associated with women’s quality of life, whereas a positive relationship was observed among men. At the same time, providing care for grandchildren was positively associated with quality of life for both grandmothers and grandfathers.
Conclusions
The presented analysis of the socio demographic structure of grandparents in Poland contributes to the broader debate on transformations in family structures. The findings demonstrate that intergenerational relationships, particularly active involvement in grandchild care, play a significant role in shaping older adults’ quality of life. The results offer important implications for family, ageing, and labour market policies, highlighting the need to acknowledge the role of grandparents in childcare support systems while also considering the socio cultural context in which grandparental care is sometimes perceived as an obligation that may negatively affect older adults’ well being.
Keywords
SHARE, grandparents, grandchild care, quality of life
Cel
Barometr ubóstwa to narzędzie służące do monitorowania złożonych, wielowymiarowych form deprywacji na poziomie lokalnym. Ze względu na nieostry charakter wielu wskaźników nowe ujęcie barometru stanowi naturalny obszar zastosowania metod opartych na zorientowanych liczbach rozmytych (OFN), które pozwalają modelować zarówno poziom zjawiska, jak i jego kierunek oraz asymetrię. Mając na uwadze przedstawione uwarunkowania teoretyczne i metodologiczne, zasadne staje się jednoznaczne określenie celu badania, którym było skonstruowanie Barometru Ubóstwa Mazowsza (BUM) z wykorzystaniem OFN.
Metody
Koncepcja metodologiczna Mazowieckiego Barometru Ubóstwa (BUM) opiera się na potrzebie uchwycenia ukrytych i wielowymiarowych form deprywacji, które pozostają niewidoczne w klasycznych ramach statystycznych. Podejście badawcze oparto na zorientowanych liczbach rozmytych. Zorientowanie liczby rozmytej wprowadza dodatkową informację o tym, w którą stronę rozmycie jest bardziej znaczące — czy niepewność dotyczy raczej pogorszenia, czy poprawy sytuacji społecznej. W badaniu zastosowano dwie miary: energii i entropii. Energia ujawnia siłę oddziaływania problemu, a entropia – jego nieprzewidywalność i potencjalną dynamikę zmian. Analiza opiera się na danych dla gmin województwa mazowieckiego z lat 2012–2024 pozyskanych z Banku Danych Lokalnych GUS, co gwarantuje wysoką precyzję oraz aktualność wykorzystanych informacji. Kluczowym założeniem badań jest zapewnienie pełnej powtarzalności procedur badawczych, umożliwiającej systematyczne monitorowanie zmian w czasie oraz formułowanie adekwatnych rekomendacji dla polityk społecznych w kontekście dynamicznie ewoluujących uwarunkowań. Takie ramy metodologiczne zwiększają interpretowalność Barometru Ubóstwa Mazowsza (BUM) i wspierają identyfikację subtelnych, pojawiających się stref ryzyka, których tradycyjne wskaźniki nie są w stanie wykryć.
Wyniki
Dzięki zastosowaniu OFN możliwe jest uchwycenie nie tylko skali ubóstwa, ale także jego struktury i potencjalnej dynamiki. Zorientowane liczby rozmyte pozwalają modelować nieprecyzyjne informacje, które trudno jednoznacznie zaklasyfikować w ramach tradycyjnych metod statystycznych. Wprowadzenie dodatkowych miar – energii i entropii – wzmacnia analityczną wartość barometru. Energia liczby rozmytej odzwierciedla intensywność i siłę badanego zjawiska, co umożliwia identyfikację obszarów o szczególnie skoncentrowanym ubóstwie. Z kolei entropia opisuje stopień nieostrości i niepewności, wskazując gminy o niestabilnej lub wewnętrznie sprzecznej sytuacji społecznej.
Wnioski
Połączenie barometru z metodami opartymi na zorientowanych liczbach rozmytych pozwala identyfikować obszary o silnym i jednocześnie chaotycznym charakterze ubóstwa oraz budować mapy ryzyka wspierające system wczesnego ostrzegania. Takie podejście dostarcza decydentom narzędzi umożliwiających trafniejsze diagnozowanie i projektowanie polityk publicznych, szczególnie tam, gdzie tradycyjne metody statystyczne nie oddają pełnej złożoności zjawisk społecznych. Dodatkowo integracja danych wielowymiarowych z logiką rozmytą pozwala uchwycić subtelne gradacje ryzyka, które w klasycznych ujęciach pozostają niewidoczne, wzmacniając potencjał analityczny i predykcyjny narzędzia.
Słowa kluczowe:
ubóstwo, obiektywne miary, polityka społeczna, wielowymiarowe podejście, zorientowane liczby rozmyte
Pobierz prezentację (docx, 21 kB)Objective
The poverty barometer is a tool for monitoring complex, multidimensional forms of deprivation at the local level. Due to the inherently imprecise nature of many indicators, the new approach to the barometer constitutes a natural area for applying methods based on Oriented Fuzzy Numbers (OFN), which make it possible to model both the level of the phenomenon and its direction and asymmetry. Considering the theoretical and methodological premises outlined above, it becomes justified to clearly define the aim of the study, which was to construct the Mazovia Poverty Barometer (MPB) using OFN.
Methods
The methodological concept of the Mazovia Poverty Barometer (MPB) is grounded in the need to capture hidden and multidimensional forms of deprivation that remain invisible in classical statistical frameworks. The research approach was based on oriented fuzzy numbers. The orientation of a fuzzy number introduces additional information about the direction in which the fuzziness is more pronounced—whether the uncertainty relates primarily to a potential deterioration or improvement in the social situation. Two measures were also applied in the study: energy and entropy. Energy reflects the strength of the problem’s impact, while entropy captures its unpredictability and the potential dynamics of change. The analysis draws on data for municipalities of the Mazowieckie Voivodeship for the years 2012–2024, obtained from the Local Data Bank of Statistics Poland, ensuring high precision and up-to-date information. A key assumption of the study is to ensure full repeatability of the research procedures, enabling systematic monitoring of changes over time and the formulation of appropriate recommendations for social policy in the context of dynamically evolving conditions. This methodological framework enhances the interpretability of the Mazovia Poverty Barometer (MPB) and supports the identification of subtle, emerging risk zones that traditional indicators fail to detect.
Results
The use of OFN makes it possible to capture not only the scale of poverty but also its structure and potential dynamics. Oriented fuzzy numbers allow for modelling imprecise information that is difficult to classify unambiguously within traditional statistical methods. The introduction of additional measures—energy and entropy—further enhances the analytical value of the barometer. The energy of a fuzzy number reflects the intensity and strength of the phenomenon, enabling the identification of areas with particularly concentrated poverty. Entropy, in turn, describes the degree of fuzziness and uncertainty, indicating municipalities with unstable or internally inconsistent social conditions.
Conclusions
Combining the barometer with methods based on oriented fuzzy numbers makes it possible to identify areas where poverty is both intense and chaotic, as well as to develop risk maps that support early-warning systems. This approach provides decision-makers with tools that enable more accurate diagnosis and the design of public policies, particularly in contexts where traditional statistical methods fail to capture the full complexity of social phenomena. Additionally, integrating multidimensional data with fuzzy logic allows subtle gradations of risk to be detected—patterns that remain invisible in classical approaches—thereby strengthening the analytical and predictive capacity of the tool.
Keywords
poverty, objective measures, social policy, multidimensional approaches, oriented fuzzy numbers
Cel
Celem wystąpienia jest przedstawienie udziału podmiotów ekonomii społecznej (PES) w świadczeniu usług społecznych w Polsce, z uwzględnieniem nowych obszarów usług oraz ich odbiorców. Analiza stanowi kontynuację prac GUS zapoczątkowanych w ramach projektu „Zintegrowany System Monitorowania Sektora Ekonomii Społecznej” i odpowiada na zapotrzebowanie instytucji publicznych odpowiedzialnych za monitorowanie PES na aktualne dane dotyczące usług społecznych. Zagadnienie to ma szczególne znaczenie w kontekście zmian społecznych i demograficznych.
Metody
Analiza opiera się na danych statystyki publicznej pochodzących ze sprawozdań GUS, uzupełnionych informacjami z zewnętrznych źródeł administracyjnych (z Ministerstwa Rodziny, Pracy i Polityki Społecznej, Ministerstwa Zdrowia, Ministerstwa Edukacji Narodowej, Państwowego Funduszu Rehabilitacji Osób Niepełnosprawnych, Głównego Inspektoratu Weterynarii oraz urzędów wojewódzkich). Analizę przygotowano w ramach nowego projektu „EStakada – synchronizacja ekonomii społecznej na poziomie kraju”, współfinansowanego ze środków UE i realizowanego w partnerstwie z Ministerstwem Rodziny, Pracy i Polityki Społecznej oraz Instytutem Pracy i Spraw Socjalnych. W porównaniu z wcześniejszymi opracowaniami znacząco rozszerzono zakres badawczy – zarówno o dodatkowe obszary usług społecznych, jak i o dane dotyczące ich odbiorców. Analiza obejmuje wszystkie jednostki realizujące usługi społeczne w formie instytucjonalnej. Proces przygotowania danych był złożony i czasochłonny – obejmował integrację oraz weryfikację informacji pochodzących z blisko 30 źródeł. W analizie prezentowana jest struktura placówek świadczących usługi społeczne według rodzaju podmiotu prowadzącego oraz zmiany w ich liczbie w czasie. Analizy prowadzone są w przekroju obszarów usług społecznych oraz jednostek terytorialnych. Przyjęte podejście umożliwia spójne i nowatorskie ujęcie badanego zjawiska oraz jego dynamiki.
Wyniki
Dotychczasowe wyniki oraz wstępna analiza najnowszych danych wskazują na zróżnicowane znaczenie PES w poszczególnych obszarach usług społecznych. Szczególnie istotny ich udział obserwuje się w usługach skierowanych do osób z niepełnosprawnościami (68,1%) oraz w obszarze zatrudnienia socjalnego (52,4%), a także – jako rozszerzenie dotychczasowego zakresu analizy – w obszarze kultury fizycznej (98,3%). Jednocześnie znaczenie PES pozostaje ograniczone w takich obszarach jak promocja i ochrona zdrowia (3,2%) czy turystyka (2,8%), gdzie dominują inne typy podmiotów. Rozszerzenie analizy o nowe obszary pozwala uchwycić szeroką definicję usług społecznych i dzięki temu pełniej przedstawić różnice w świadczeniu usług społecznych.
Wnioski
Rozszerzenie zakresu analiz umożliwia pełniejsze monitorowanie roli PES w świadczeniu usług społecznych oraz skali korzystania z tych usług, w tym liczby ich odbiorców. Jednocześnie pozwala uchwycić zróżnicowanie działalności tych podmiotów w poszczególnych obszarach usług społecznych. Aktualne dane zwiększają użyteczność wyników dla decydentów publicznych i wspierają projektowanie polityk społecznych. Wyniki analiz realizowanych w ramach projektu „EStakada” dostarczają Ministerstwu Rodziny, Pracy i Polityki Społecznej praktycznych informacji wspierających monitorowanie PES i podejmowanie decyzji w obszarze usług społecznych.
Słowa kluczowe:
usługi społeczne, ekonomia społeczna, przedsiębiorstwa społeczne, odbiorcy usług
Pobierz prezentację (docx, 18 kB)Objective
The objective of this presentation is to describe the role of social economy entities (SEE) in the provision of social services in Poland, taking into account new service areas and their recipients. This analysis continues the work of Statistics Poland initiated as part of the “Integrated Monitoring System for the Social Economy Sector” project and addresses the need of public institutions responsible for monitoring SEE for up-to-date data on social services. This issue is of particular importance in the context of social and demographic changes.
Methods
The analysis is based on public statistics from Statistics Poland reports, supplemented with information from external administrative sources (from the Ministry of Family, Labour and Social Policy, the Ministry of Health, the Ministry of National Education, State Fund for Rehabilitation of Disable People, General Veterinary Inspectorate and Provincial Offices). The analysis was prepared as part of the new project “EStakada – synchronization of the social economy at the national level”, co-financed by the EU and implemented in partnership with the Ministry of Family, Labour and Social Policy and Institute of Labour and Social Affairs. Compared to previous publications, the scope of the study has been significantly expanded – both to include additional areas of social services and to incorporate data on their recipients. The analysis covers all entities providing social services in an institutional form. The data preparation process was complex and time-consuming – it involved integrating and verifying information from nearly 30 sources. The analysis presents the structure of social service providers by type of operating entity and changes in their numbers over time. The analyses are conducted across social services areas and local government units. The adopted approach enables a coherent and innovative understanding of the phenomenon under study and its dynamics.
Results
The results to date and a preliminary analysis of the latest data indicate that the role of SEE varies across different areas of social services. Their participation is particularly significant in services for people with disabilities (68.1%) and in the area of social employment (52.4%), as well as – as an extension of the current scope of the analysis – in the area of physical culture (98.3%). At the same time, the role of SEE remains limited in areas such as promotion and health protection (3.2%) or tourism (2.8%), where other types of entities dominate. Expanding the analysis to include new areas allows for a broader definition of social services and, as a result, a more comprehensive presentation of the differences in the provision of social services.
Conclusions
Expanding the scope of the analyses allows for more comprehensive monitoring of the role of SEE in the provision of social services and the scale of use of these services, including the number of recipients. At the same time, it makes it possible to capture the diversity of these entities’ activities across specific areas of social services. Up-to-date data increases the usefulness of the results for public policymakers and supports the design of social policies. The results of the analyses conducted as part of the EStakada project provide the Ministry of Family, Labour and Social Policy with practical information to support the monitoring of SEE and decision-making in the area of services.
Keywords
social services, social economy, social enterprises, service recipients
Cel
Celem referatu jest identyfikacja głównych motywacji, a także wyzwań i barier związanych z wdrażaniem przez gospodarstwa domowe na Dolnym Śląsku, w Saksonii oraz w Kraju Libereckim innowacji proekologicznych na rzecz poprawy jakości powietrza, ze szczególnym uwzględnieniem czynników ekonomicznych, społecznych i instytucjonalnych wpływających na decyzje inwestycyjne oraz skalę i tempo wdrażania tych rozwiązań.
Metody
Podstawowym źródłem danych wykorzystanych w referacie są wyniki badania pierwotnego – autorskiego badania ankietowego pt. „Proekologiczne działania i inwestycje w gospodarstwach domowych sprzyjające poprawie jakości powietrza – wyzwania i bariery”, zrealizowanego w IV kwartale 2024 roku przez Instytut Rozwoju Terytorialnego, Urząd Statystyczny we Wrocławiu oraz Instytut Nauk Ekonomicznych Uniwersytetu Wrocławskiego. Badanie zostało sfinansowane ze środków Urzędu Marszałkowskiego Województwa Dolnośląskiego. Próba badawcza liczyła 1819 respondentów i miała charakter zróżnicowany pod względem społeczno-ekonomicznym. Narzędziem badawczym był kwestionariusz internetowy skierowany do osób odpowiedzialnych za podejmowanie decyzji ekonomicznych w gospodarstwie domowym. Zakres przestrzenny badania obejmował województwo dolnośląskie oraz – analizowane odrębnie – regiony tzw. Trójziemia: wschodnią Saksonię, Kraj Liberecki oraz podregion jeleniogórski. Uzupełniająco wykorzystano dane wtórne statystyki publicznej oraz dane Eurostatu, zwłaszcza w odniesieniu do zjawiska ubóstwa energetycznego. W analizie zastosowano metody statystyki opisowej oraz wielowymiarową analizę porównawczą, umożliwiające identyfikację zróżnicowań przestrzennych i kluczowych zależności.
Wyniki
Wyniki badań wskazują na istotne zróżnicowanie obszarów przygranicznych pod względem wykorzystywanych paliw i źródeł energii, zwłaszcza udziału odnawialnych źródeł energii. Głównymi motywami wdrażania energooszczędnych rozwiązań były chęć obniżenia kosztów ogrzewania oraz dostęp do dofinansowania. Respondenci z Czech częściej niż z Polski wskazywali na motywację związaną z wdrażaniem nowoczesnych technologii. Najważniejszą barierą pozostają czynniki ekonomiczne, w szczególności wysokie koszty inwestycyjne. Skłonność do wdrażania ekoinnowacji różnicują m.in. świadomość ekologiczna, znajomość przepisów, ocena jakości powietrza oraz sytuacja finansowa gospodarstw domowych.
Wnioski
Wyniki stanowią istotny wkład w poszerzenie wiedzy na temat działań wspierających transformację energetyczną w kontekście relacji transgranicznych między Polską, Czechami i Niemcami. Stanowią one podstawę do formułowania rekomendacji dla polityki rozwoju regionalnego, ukierunkowanych na zwiększenie skuteczności wdrażania nieemisyjnych źródeł energii, w tym wzmocnienia mechanizmów wsparcia finansowego, podnoszenia świadomości społecznej, poprawy dostępu do informacji oraz rozwoju współpracy transgranicznej w zakresie zrównoważonych rozwiązań energetycznych.
Słowa kluczowe:
ekoinnowacje, transformacja energetyczna, zachowania gospodarstw domowych
Pobierz prezentację (docx, 31 kB)Objective
The aim of the paper is to identify the main motivations, as well as the challenges and barriers associated with the implementation of eco-innovations aimed at improving air quality by households in Lower Silesia, Saxony, and the Liberec Region, with particular emphasis on economic, social, and institutional factors influencing investment decisions as well as the scale and pace of their adoption.
Methods
The primary data source used in the paper consists of the results of an original survey entitled “Pro-environmental activities and investments in households contributing to improved air quality – challenges and barriers”, conducted in the fourth quarter of 2024 by the Institute for Territorial Development, the Statistical Office in Wrocław, and the Institute of Economic Sciences at the University of Wrocław. The study was funded by the Marshal’s Office of the Lower Silesian Voivodeship. The research sample comprised 1,819 respondents and was socio-economically diverse. The research instrument was an online questionnaire addressed to individuals responsible for economic decision-making within households. The spatial scope of the study covered the Lower Silesian Voivodeship as well as—analyzed separately—the so-called “Three Lands” regions: Eastern Saxony, the Liberec Region, and the Jelenia Góra subregion. In addition, secondary data from official statistics and Eurostat were used, particularly with regard to energy poverty. The analysis employed descriptive statistics and multivariate comparative methods, enabling the identification of spatial differences and key relationships.
Results
The results indicate significant differences across border regions in terms of the fuels and energy sources used, particularly regarding the share of renewable energy. The main drivers of adopting energy-efficient solutions include the desire to reduce heating costs and access to financial support. Respondents from the Czech Republic more often than those from Poland pointed to motivations related to the adoption of modern technologies. The primary barrier remains economic factors, especially high investment costs. The propensity to implement eco-innovations is influenced, among others, by environmental awareness, knowledge of regulations, perceived air quality, and the financial situation of households.
Conclusions
The findings provide a valuable contribution to expanding knowledge on actions supporting the energy transition within the context of cross-border relations between Poland, the Czech Republic, and Germany. They form the basis for policy recommendations aimed at increasing the effectiveness of implementing zero-emission energy sources, including strengthening financial support mechanisms, enhancing public awareness, improving access to information, and fostering cross-border cooperation in the field of sustainable energy solutions.
Keywords
eco innovations, energy transition, household behaviour
Cel
Celem referatu jest ocena jakości życia w miejskich obszarach funkcjonalnych (MOF) miast wojewódzkich w Polsce z wykorzystaniem funkcjonalnej analizy głównych składowych (FPCA). MOF utworzono w celu wspierania wspólnego rozwoju i poprawy jakości życia mieszkańców, co wpisuje się w realizację Celu Zrównoważonego Rozwoju 11 Agendy ONZ 2030. Jakość życia jest zjawiskiem wielowymiarowym, najczęściej mierzonym za pomocą zestawu wskaźników statycznych. W referacie zaproponowano podejście funkcjonalne, pozwalające uchwycić czasową i przestrzenną dynamikę zjawiska.
Metody
Badaniem objęto wszystkie 17 MOF miast wojewódzkich w Polsce za lata 2014-2022 (w województwie kujawsko-pomorskim wyodrębniono jeden MOF dwóch miast Bydgoszczy i Torunia, a w lubuskim dwa odrębne MOF Zielonej Góry i Gorzowa Wielkopolskiego). Dane pochodzą z Banku Danych Lokalnych GUS oraz z publikacji Ministerstwa Finansów. Początkowo rozważano 68 zmiennych diagnostycznych opisujących jakość życia w następujących obszarach: rynek pracy, edukacja, kultura, ochrona środowiska, demografia, infrastruktura gospodarcza oraz dochody budżetów gmin. W celu wyboru istotnych zmiennych zastosowano metodę HINoV (ang. Heuristic Identification of Noisy Variables) z punktem odcięcia wyznaczonym na podstawie wykresu osypiska Cattella, co pozwoliło wybrać 35 kluczowych zmiennych diagnostycznych. Wartości zmiennych poddano unitaryzacji zerowanej. Funkcjonalne wygładzanie zrealizowano z wykorzystaniem bazy Fouriera, przyjmując pięć wyrazów w rozwinięciu dla każdej zmiennej. W kolejnym kroku zastosowano FPCA, która redukuje przestrzeń wielowymiarowych danych funkcjonalnych do skończonego zbioru współrzędnych w przestrzeni głównych składowych. Klasyfikacji MOF dokonano metodą Warda, a optymalną liczbę skupień wyznaczono na podstawie kryterium Mojeny. Zgodność klasyfikacji uzyskanych obiema metodami oceniono za pomocą współczynnika korelacji rang Spearmana oraz indeksu Fowlkesa-Mallowsa.
Wyniki
Pierwsze dwie funkcjonalne główne składowe wyjaśniają niespełna 60% całkowitej zmienności zmiennych pierwotnych - pierwsza około 44%, druga około 16%. Pierwsza składowa, opisująca aktywność gospodarczą i rozwój infrastruktury, oraz druga składowa, opisująca trudności na rynku pracy i dostępność usług, pozwoliły wyodrębnić cztery skupienia MOF. Najwyższą jakością życia charakteryzują się MOF największych i najbardziej rozwiniętych gospodarczo miast, najniższą zaś obszary skoncentrowane wokół mniejszych miast w południowo-zachodniej i wschodniej części Polski. Klasyfikacja metodą Warda jest zgodna z klasyfikacją uzyskaną w wyniku projekcji na pierwsze dwie składowe (współczynnik Spearmana 0,993, indeks Fowlkesa-Mallowsa 0,943).
Wnioski
FPCA okazała się skutecznym narzędziem identyfikacji i kwantyfikacji przestrzennego zróżnicowania jakości życia w hierarchii miejskiej Polski. Funkcjonalne ujęcie danych pozwala uwzględnić zarówno poziom, jak i dynamikę zmiennych w całym analizowanym okresie, jednocześnie istotnie redukując wymiarowość problemu. Uzyskane wyniki mogą stanowić podstawę do projektowania polityki rozwoju regionalnego i lokalnego, w tym alokacji środków w ramach Zintegrowanych Inwestycji Terytorialnych. Zaproponowane podejście jest możliwe do zastosowania w innych analizach regionalnych, w których dane mają charakter wielowymiarowych szeregów czasowych.
Słowa kluczowe:
jakość życia, miejskie obszary funkcjonalne, rozwój regionalny, funkcjonalna analiza głównych składowych (FPCA), funkcjonalna analiza danych (FDA)
Pobierz prezentację (docx, 19 kB)Objective
The aim of the paper is to assess quality of life in the Functional Urban Areas (FUAs) of provincial cities in Poland using Functional Principal Component Analysis (FPCA). FUAs were established to support joint development and improve the quality of life of residents, in line with Sustainable Development Goal 11 of the UN 2030 Agenda. The paper proposes a functional approach that makes it possible to capture the temporal and spatial dynamics of this multidimensional phenomenon, often measured by means of static indicators.
Methods
The study covered all 17 FUAs of provincial cities in Poland for 2014–2022 (in the Kujawsko-Pomorskie voivodeship, a single FUA covers Bydgoszcz and Toruń, while in the Lubuskie voivodeship two separate FUAs cover Zielona Góra and Gorzów Wielkopolski). The data come from the Local Data Bank of Statistics Poland and from publications of the Ministry of Finance. Initially, 68 diagnostic variables describing quality of life were considered, covering the labour market, education, culture, environmental protection, demography, economic infrastructure, and municipal budget revenues. To select the relevant variables, the HINoV method (Heuristic Identification of Noisy Variables) was applied, with the cut-off point determined on the basis of Cattell`s scree plot, which made it possible to select 35 key diagnostic variables. The values were transformed by zero-based unitarisation. Functional smoothing was carried out using a Fourier basis with five expansion terms per variable. Next, FPCA was applied, reducing the space of multivariate functional data to a finite set of coordinates in the principal component space. The classification of the FUAs was carried out using Ward`s method, with the optimal number of clusters determined by Mojena`s criterion. The consistency of both classifications was assessed using Spearman`s rank correlation coefficient and the Fowlkes-Mallows index.
Results
The first two functional principal components account for nearly 60% of the total variability - about 44% and 16% respectively. The first component, describing economic activity and infrastructure development, and the second, describing labour market difficulties and service accessibility, made it possible to distinguish four clusters of FUAs. The highest quality of life is found in the FUAs of the largest and most economically developed cities, while the lowest is observed in areas centred on smaller cities in the south-western and eastern parts of Poland. Ward`s classification is consistent with the projection onto the first two components (Spearman`s coefficient 0.993, Fowlkes-Mallows index 0.943).
Conclusions
FPCA proved to be an effective tool for identifying and quantifying the spatial differentiation of quality of life within the Polish urban hierarchy. The functional treatment of the data makes it possible to take into account both the level and the dynamics of the variables over the entire analysed period, while at the same time substantially reducing the dimensionality of the problem. The results obtained may serve as a basis for designing regional and local development policies, including the allocation of funds under Integrated Territorial Investments. The proposed approach can be applied in other regional analyses in which the data have the character of multivariate time series.
Keywords
quality of life, functional urban areas, regional development, functional principal component analysis (FPCA), functional data analysis (FDA)
Cel
Zgłoszenie do sesji posterowej Celem badania eksperymentalnego jest dostarczenie szczegółowych informacji o zawodach faktycznie wykonywanych przez osoby pracujące w gospodarce narodowej oraz osoby wykonujące pracę wyłącznie na podstawie umów cywilnoprawnych. Równolegle prowadzone są prace nad rozszerzeniem zakresu analiz o informacje dotyczące kompetencji wymaganych w procesach rekrutacyjnych, pozyskiwane na podstawie internetowych ogłoszeń o pracę, co pozwoli na lepsze powiązanie struktury zawodowej z zapotrzebowaniem na umiejętności.
Metody
Kluczowym założeniem metodologicznym było skupienie się na zawodach faktycznie wykonywanych, a nie na zawodach wyuczonych czy formalnych kwalifikacjach. Badanie oparto na rejestrach administracyjnych pozyskiwanych w ramach Programu Badań Statystycznych Statystyki Publicznej (PBSSP) oraz danych z badań realizowanych przez Główny Urząd Statystyczny, co umożliwiło przeprowadzenie prac bez dodatkowych kosztów. Głównym źródłem informacji o zawodach wykonywanych były dane zgłaszane przez pracodawców do Zakładu Ubezpieczeń Społecznych w formularzu rejestracyjnym. Zawody określono na poziomie elementarnym (czteroznakowym) zgodnie z Klasyfikacją Zawodów i Specjalności (KZiS). Proces identyfikacji zawodów przebiegał etapowo i wymagał zastosowania zaawansowanych metod integracji danych oraz opracowania złożonych algorytmów decyzyjnych. Istotnym elementem tego procesu była integracja danych z wielu źródeł, przeprowadzona metodą deterministyczną z wykorzystaniem jednego klucza łączenia (numer PESEL) lub wielu kluczy (imię, nazwisko, data urodzenia itp.). Wymagała ona odpowiedniego doboru danych z uwzględnieniem ich jakości, rozumianej jako aktualność, kompletność, porównywalność i spójność. Integracja była ważna zarówno pod względem podmiotowym – zapewnienia objęcia badaniem wszystkich jednostek należących do populacji, jak i przedmiotowym – uzyskania możliwie kompletnych i aktualnych informacji o faktycznie wykonywanych zawodach.
Wyniki
Wśród pracujących w gospodarce narodowej dominują sprzedawcy sklepowi i kasjerzy, kierowcy samochodów ciężarowych, magazynierzy oraz nauczyciele szkół podstawowych. Łącznie cztery wymienione grupy stanowią 13,5% wszystkich zawodów obecnych na rynku pracy, co podkreśla ich istotną rolę w strukturze zatrudnienia. W przypadku osób wykonujących pracę wyłącznie na podstawie umów cywilnoprawnych najczęściej reprezentowane są zawody o charakterze pomocniczym, takie jak pomoce i sprzątaczki biurowe, hotelowe i pokrewne oraz robotnicy wykonujący prace proste w przemyśle. Średni wiek pracujących jest wyraźnie zróżnicowany między zawodami – od 29 lat (pracownicy fast food, sportowcy) do 56 lat (lekarze specjaliści).
Wnioski
Wyniki badania stanowią cenne źródło wiedzy wspierające monitorowanie kluczowych wyzwań rynku pracy, w tym identyfikację zawodów deficytowych oraz narażonych na automatyzację i rozwój sztucznej inteligencji. Szczegółowa wiedza o strukturze zawodowej jest niezbędna nie tylko dla zrozumienia bieżących procesów na rynku pracy, lecz także do projektowania długofalowych strategii rozwojowych odpowiadających na wyzwania technologiczne, demograficzne i migracyjne. Zastosowana metodologia umożliwia częste aktualizacje oraz prowadzenie analiz według płci, wieku, regionu (na poziomie gmin), wspierając politykę zatrudnienia, edukacji i kształcenia zawodowego opartą na danych.
Słowa kluczowe:
struktura zawodowa, rynek pracy, dane administracyjne, statystyka eksperymentalna
Pobierz prezentację (docx, 23 kB)Objective
The objective of the experimental study was to provide detailed information on the occupations actually performed by persons employed in the national economy and by persons working exclusively under civil-law contracts. In parallel, work is under way to extend the scope of analyses to include information on competencies required in recruitment processes, sourced from online job advertisements, which will allow for a closer alignment between the occupational structure and demand for skills.
Methods
The key methodological assumption was to focus on occupations actually performed rather than on qualifications obtained or formal credentials. The study drew on administrative registers acquired under the Statistical Research Programme of Public Statistics (PBSSP) and data from surveys conducted by Statistics Poland, allowing the research to be carried out without additional costs. The primary source of information on performed occupations was data reported by employers to the Social Insurance Institution (ZUS) via registration forms. Occupations were classified at the elementary (four-digit) level in accordance with the Classification of Occupations and Specialisations (KZiS). The occupation identification process was carried out in stages and required the application of advanced data integration methods and the development of complex decision-making algorithms. A critical component of this process was the integration of data from multiple sources, performed using a deterministic method based on either a single linkage key (PESEL national identification number) or multiple keys (first name, surname, date of birth, etc.). Integration was essential both from a unit coverage perspective — ensuring that all entities within the target population were included in the study — and from a subject-matter perspective — obtaining the most complete and up-to-date information on occupations actually performed.
Results
Among persons employed in the national economy, the most prevalent occupations are shop sales assistants and cashiers, heavy goods vehicle drivers, warehouse workers, and primary school teachers. Together, these four groups account for 13.5% of all occupations present in the labour market, underscoring their significant role in the employment structure. Among persons working exclusively under civil-law contracts, the most frequently represented are occupations of an auxiliary nature, such as office, hotel and related cleaners and helpers, and labourers performing simple industrial tasks. The average age of workers varies markedly across occupations – ranging from 29 years (fast food workers, athletes) to 56 years (medical specialists).
Conclusions
The findings of the study constitute a valuable source of knowledge supporting the monitoring of key labour market challenges, including the identification of occupations in shortage and those susceptible to automation and the advancement of artificial intelligence. Detailed knowledge of the occupational structure is indispensable not only for understanding current processes in the labour market, but also for designing long-term development strategies that address technological, demographic and migratory challenges. The methodology employed enables frequent updates and analyses disaggregated by sex, age and region (at the commune level), thereby supporting evidence-based employment.
Keywords
occupational structure, labour market, administrative data, experimental statistics
Cel
Celem badania jest wyjaśnienie przyczyn gwałtownego spadku dzietności w Polsce, Litwie, Łotwie i Estonii w latach 2017–2024 poprzez rozróżnienie wpływu czynników strukturalnych i behawioralnych. Analiza ma ustalić, w jakim stopniu obserwowane zmiany wynikają z przemian demograficznych, a w jakim z reakcji na nakładające się kryzysy – pandemię COVID-19 i wojnę w Ukrainie – oraz towarzyszącą im niepewność ekonomiczną i społeczną.
Metody
Badanie opiera się na analizie danych demograficznych dla lat 2017–2024, obejmujących statystyki urodzeń, dane Eurostatu oraz krajowych urzędów statystycznych. Kluczową metodą jest dekompozycja zmian współczynnika dzietności całkowitej (TFR) z wykorzystaniem podejścia Kitagawy (1955) oraz Das Gupty (1993), pozwalająca rozdzielić wpływ czynników strukturalnych (zmiany w strukturze wieku i liczbie kobiet według liczby urodzonych dzieci) oraz behawioralnych (zmiany intensywności urodzeń w poszczególnych grupach). Uzupełniająco zastosowano korektę tempa dzietności według Bongaartsa i Feeneya (1998), która eliminuje zniekształcenia wynikające z odkładania urodzeń w czasie. Analiza obejmuje wskaźniki dzietności według wieku oraz kolejności urodzeń, co umożliwia identyfikację zmian w zakresie pierwszych, drugich i kolejnych urodzeń. W celu oceny wpływu kryzysów zastosowano podejście kontrfaktyczne typu event-study, porównujące trajektorie dzietności po 2022 roku z trendami sprzed pandemii oraz z krajami referencyjnymi Europy Zachodniej i Środkowej, różniącymi się poziomem stabilności instytucjonalnej i odległością od konfliktu. Takie podejście pozwala uchwycić zarówno bezpośredni wpływ zdarzeń, jak i ich interakcje z długookresowymi procesami demograficznymi.
Wyniki
W Polsce współczynnik dzietności całkowitej spadł z ok. 1,45 w 2017 r. do ok. 1,10 w 2024 r., co oznacza spadek o blisko 24%. Analiza dekompozycyjna wskazuje, że około 80% tej zmiany wynikało z czynników behawioralnych, podczas gdy jedynie 20% można przypisać zmianom strukturalnym. Najsilniejsze spadki odnotowano wśród kobiet w wieku 25–34 lata, szczególnie w zakresie pierwszych urodzeń, które odpowiadają za większość spadku po 2021 r. Jednocześnie wzrósł średni wiek matek, co potwierdza odkładanie decyzji prokreacyjnych. Nałożenie się pandemii COVID-19 i wojny w Ukrainie stworzyło efekt „podwójnego szoku”, który nie tylko opóźnił realizację planów rodzicielskich, lecz także przyczynił się do bardziej trwałych zmian w zachowaniach i intencjach reprodukcyjnych.
Wnioski
Wyniki wskazują, że spadek dzietności w Polsce ma przede wszystkim charakter behawioralny i wynika z reakcji na narastającą niepewność wywołaną pandemią oraz wojną w Ukrainie, a nie z długookresowych zmian strukturalnych. Kluczową rolę odegrało odkładanie decyzji o pierwszym dziecku, co może mieć trwałe konsekwencje dla poziomu dzietności. Analiza potwierdza znaczenie czynników ekonomicznych i geopolitycznych w kształtowaniu zachowań reprodukcyjnych oraz ograniczoną odporność demograficzną na skumulowane kryzysy.
Słowa kluczowe:
dzietność, niepewność, pandemia COVID-19, wojna w Ukrainie, dekompozycja demograficzna
Pobierz prezentację (pdf, 47 kB)Objective
The aim of the study is to explain the sharp fertility decline in Poland, Lithuania, Latvia, and Estonia between 2017 and 2024 by distinguishing between structural and behavioral determinants. The analysis seeks to assess to what extent the observed changes result from demographic shifts versus behavioral responses to overlapping crises—namely the COVID-19 pandemic and the war in Ukraine—and the associated economic and social uncertainty.
Methods
The study is based on demographic data for the period 2017–2024, including vital statistics, Eurostat data, and national statistical office records. The core methodological approach is the decomposition of changes in the total fertility rate (TFR) using the frameworks developed by Kitagawa (1955) and Das Gupta (1993), which allow the separation of structural components (changes in the age and parity composition of women) from behavioral components (changes in fertility rates within these groups). Additionally, tempo-adjusted fertility measures following Bongaarts and Feeney (1998) are applied to correct for distortions caused by the postponement of births. The analysis includes age-specific and parity-specific fertility rates, enabling the identification of shifts in first, second, and higher-order births. To evaluate the impact of crises, a counterfactual event-study design is employed, comparing post-2022 fertility trajectories with pre-pandemic trends and with selected Western and Central European countries that differ in institutional stability and proximity to the conflict. This approach allows capturing both the direct effects of shocks and their interaction with longer-term demographic processes.
Results
In Poland, the total fertility rate declined from approximately 1.45 in 2017 to around 1.10 in 2024, representing a drop of nearly 24%. Decomposition results indicate that about 80% of this decline was driven by behavioral factors, while only 20% can be attributed to structural changes. The most pronounced decreases were observed among women aged 25–34, particularly in first births, which account for the majority of the post-2021 decline. At the same time, the mean age at childbirth increased, indicating postponement of reproductive decisions. The combined impact of the pandemic and the war produced a “double shock” that reinforced lasting changes in fertility behavior.
Conclusions
The findings suggest that the fertility decline in Poland is primarily behavioral and reflects responses to rising uncertainty caused by the pandemic and the war in Ukraine, rather than long-term structural demographic changes. The postponement of first births plays a central role and may have lasting implications for future fertility levels. The study highlights the importance of economic and geopolitical factors in shaping reproductive behavior and points to limited demographic resilience in the face of compounded crises.
Keywords
fertility, uncertainty, COVID-19 pandemic, war in Ukraine, demographic decomposition
Cel
Celem zgłoszonego referatu jest przedstawienie wyników europejskiego badania przemocy uwarunkowanej płcią (EU-GBV - Gender-Based Violence) w Polsce, a także odpowiedź na pytanie o skalę, strukturę oraz zróżnicowanie tego zjawiska w zależności od płci a także kontekstu społecznego. Analiza koncentruje się na identyfikacji form przemocy oraz różnic w ich postrzeganiu i raportowaniu przez osoby badane. Zastosowanie wspólnej metodologii dla krajów Unii Europejskiej, umożliwia uzyskanie porównywalnych wyników i ocenę zjawiska przemocy.
Metody
Badanie EU-GBV zostało zrealizowane w ramach projektu koordynowanego na poziomie Unii Europejskiej i finansowanego przez Eurostat. W Polsce wykonawcą był Główny Urząd Statystyczny. W ramach projektu zostało przeprowadzone badanie przemocy uwarunkowanej płcią (EU-GBV) na poziomie krajowym, na losowo wybranej próbie respondentów (wyłącznie kobiet) z wykorzystaniem opracowanego na poziomie europejskim kwestionariusza i metodologii. Dane pochodzą z reprezentacyjnego badania ankietowego przeprowadzonego na próbie osób dorosłych (18+), dobranej w sposób losowy, umożliwiający uogólnianie wyników na populację kraju. Zastosowano standaryzowany kwestionariusz obejmujący różne formy przemocy (fizyczną, psychiczną, seksualną, ekonomiczną oraz przemoc cyfrową) stanowiący podstawę do wypracowania polskiej wersji kwestionariusza. W analizie wykorzystano wagi statystyczne korygujące strukturę próby względem populacji. Dokonano oceny jakości wyników poprzez analizę błędów oszacowań oraz zastosowanie podstawowych metod wnioskowania statystycznego, w tym przedziałów ufności. Uwzględniono także ograniczenia wynikające z efektu niedoszacowania zjawiska przemocy oraz różnic w gotowości respondentów do ujawniania doświadczeń.
Wyniki
Wyniki badania EU-GBV wskazują na istotną skalę przemocy uwarunkowanej płcią w Polsce oraz na jej wyraźne zróżnicowanie ze względu na płeć, wiek oraz kontekst występowania. Badanie zrealizowane zostało na grupie wylosowanych respondentek, na terenie szesnastu województw Polski. Najczęściej raportowane są formy przemocy psychicznej i ekonomicznej, przy czym kobiety znacznie częściej deklarują doświadczenie przemocy w relacjach prywatnych, a mężczyźni rzadziej ujawniają tego typu zdarzenia. Zaobserwowano także znaczący udział przemocy w przestrzeni cyfrowej oraz znaczący udział przemocy w miejscu pracy. Interpretacja wyników wskazuje na wpływ norm społecznych i kulturowych na poziom ujawniania przemocy.
Wnioski
Uzyskane wyniki z badania EU-GBV podkreślają konieczność dalszego rozwijania badań nad przemocą uwarunkowaną płcią z wykorzystaniem metod statystyki publicznej oraz doskonalenia narzędzi pomiaru. Istotne jest uwzględnianie różnic w raportowaniu przemocy oraz wzmacnianie procedur zapewniających rzetelność danych. Wyniki mają znaczenie dla kształtowania polityk publicznych, w tym działań prewencyjnych i interwencyjnych, oraz stanowią wkład w rozwój metod analizy zjawisk społecznych o charakterze wrażliwym.
Słowa kluczowe:
przemoc uwarunkowana płcią, przemoc wobec kobiet, mobbing, stalking, przemoc w dzieciństwie
Pobierz prezentację (docx, 18 kB)Objective
The aim of this paper is to present the findings of the European survey on gender-based violence (EU-GBV ) in Poland, as well as to address the scale, structure as well as variations of this phenomenon depending on gender and social context. The analysis focuses on identifying forms of violence and differences in how they are perceived and reported by respondents.The use of a common methodology across European Union countries makes it possible to obtain comparable results and assess the phenomenon of violence.
Methods
The EU-GBV survey was carried out as part of a project coordinated at European Union level and funded by Eurostat. In Poland, the survey was conducted by the Statistics Poland. As part of the project, a survey on gender-based violence (EU-GBV) was conducted at national level on a randomly selected sample of respondents (women only), using a questionnaire and methodology developed at European level. The data come from a representative survey conducted on a sample of adults (aged 18 and over), selected at random, allowing the results to be generalised to the country’s population. A standardised questionnaire covering various forms of violence (physical, psychological, sexual, economic and digital violence) was used as the basis for developing the Polish version of the questionnaire. The analysis utilised statistical weights to adjust the sample structure relative to the population. The quality of the results was assessed through an analysis of estimation errors and the application of basic statistical inference methods, including confidence intervals. Limitations arising from the underreporting of violence and differences in respondents’ willingness to disclose their experiences were also taken into account.
Results
The results indicate a significant scale of gender-based violence (EU-GBV) in Poland and its clear gender, age and context differences. The survey was conducted among a group of randomly selected female respondents across sixteen provinces in Poland. Most often, forms of psychological and economic violence are reported, with women more often declaring experience of violence in private relationships, and men less often revealing such events. There has also been a significant contribution of violence in the digital space and in the workplace. Interpretation of the results indicates the impact of social and cultural norms on the level of disclosure of violence.
Conclusions
The obtained results underline the need to further develop research on gender-based violence using methods of official statistics and to improve measurement tools. It is important to take into account differences in reporting violence and strengthen procedures to ensure the reliability of data. The results are important for shaping public policies, including preventive and intervention measures, and contribute to the development of methods for the analysis of social phenomena of a sensitive nature.
Keywords
gender-based violence, violence against women, mobbing, stalking, childhood violence
Cel
Celem analizy jest próba odpowiedzi na pytanie, w jaki sposób różnice w instytucjonalnym kształtowaniu opieki długoterminowej w Europie Środkowo-Wschodniej, zwłaszcza w Polsce i Czechach, wiążą się z jakością życia seniorów. Szczególną uwagę poświęcono dwóm ścieżkom rozwoju LTC w regionie: polskiemu modelowi silniej opartemu na rodzinie i subsydiarności oraz czeskiemu modelowi ograniczonego uniwersalizmu. Dodatkowo zestawiono je z reżimami opieki długoterminowej Niderlandów, Niemiec i Włoch.
Metody
Badanie wykorzystuje reprezentacyjne dane panelowe z międzynarodowego badania SHARE (Survey of Health, Ageing and Retirement in Europe). Analizą objęto 28 025 seniorów obserwowanych w 5 falach badania w Polsce, Czechach, Niemczech, Niderlandach i Włoszech. Dobór krajów miał charakter celowy i porównawczy. Polska i Czechy zostały potraktowane jako dwa przypadki Europy Środkowo-Wschodniej, które mimo wspólnej klasyfikacji regionalnej reprezentują odmienne rozwiązania instytucjonalne w zakresie opieki długoterminowej. Kontekst porównawczy zapewniają Niderlandy, Niemcy i Włochy, odpowiadające odmiennym reżimom LTC: nordyckiemu, mieszanemu i rodzinnemu. Zmienną zależną jest jakość życia mierzona wskaźnikiem CASP oraz jego domenami: kontrolą, autonomią, samorealizacją i przyjemnością. Uwzględniono także ogólną satysfakcję z życia. Główne zmienne objaśniające obejmują cztery wymiary LTC: formalną opiekę instytucjonalną, formalną opiekę domową, otrzymywanie pomocy oraz udzielanie pomocy innym. W modelach kontrolowano wpływ wieku, płci, zdrowia fizycznego i psychicznego, sytuacji finansowej, wykształcenia, stanu cywilnego, PKB per capita, nierówności dochodowych oraz pandemii COVID-19. Pandemię potraktowano jako eksperyment naturalny i „stress test” systemów LTC, pozwalający ocenić ich odporność w warunkach ograniczeń społecznych. Zastosowano regresyjne modele mieszane umożliwiające analizę ogólnych zależności między formami LTC a jakością życia oraz ich zróżnicowania między krajami.
Wyniki
Wyniki pokazują, że otrzymywanie pomocy wiąże się z niższą jakością życia seniorów, zwłaszcza w domenach kontroli i samorealizacji. Zależność ta jest silniejsza w Polsce i Czechach niż w Niemczech i Niderlandach, co sugeruje większe obciążenie zależnością tam, gdzie LTC bardziej opiera się na rodzinie lub słabszym wsparciu formalnym. Formalna opieka domowa także wiąże się z niższym CASP, szczególnie w zakresie kontroli. Opieka instytucjonalna nie wykazuje jednoznacznie negatywnego związku z ogólną jakością życia po uwzględnieniu zdrowia i zmiennych kontrolnych. Istotny jest kontrast: w Polsce udzielanie pomocy innym wiąże się z wyższą jakością życia, w Czechach – z niższą. Najsilniejszymi predyktorami pozostają zdrowie fizyczne i psychiczne oraz samoocena sytuacji finansowej.
Wnioski
Analiza daje podstawy do twierdzenia, że Europa Środkowo-Wschodnia nie jest jednolita pod względem konsekwencji opieki długoterminowej dla jakości życia seniorów. Polska i Czechy, mimo podobnej klasyfikacji regionalnej, ujawniają odmienne wzorce zależności między otrzymywaniem i udzielaniem pomocy a dobrostanem osób starszych. Znaczenie LTC zależy nie tylko od jej formalnego typu, lecz także od kontekstu instytucjonalnego, rodzinnego i kulturowego oraz od tego, czy pomoc jest doświadczana jako wsparcie i źródło sensu, czy jako oznaka zależności. Podobne formy LTC mogą zatem mieć odmienne konsekwencje w różnych reżimach opieki.
Słowa kluczowe:
opieka długoterminowa: jakość życia osób starszych: Polska, Czechy: SHARE
Pobierz prezentację (docx, 32 kB)Objective
The study aims to examine how differences in the institutional design of long-term care (LTC) in Central and Eastern Europe, particularly in Poland and Czechia, are associated with older adults’ quality of life. Special attention is given to two regional LTC trajectories: the more family-based and subsidiarity-oriented Polish model and the Czech model of limited universalism. These are further contrasted with LTC regimes in the Netherlands, Germany, and Italy.
Methods
The analysis uses representative panel data from the SHARE study (Survey of Health, Ageing and Retirement in Europe), covering 28,025 older adults across five waves in Poland, Czechia, Germany, the Netherlands, and Italy. Country selection was purposeful and comparative. Poland and the Czech Republic are treated as two Central and Eastern European cases that, despite sharing a common regional classification, represent distinct institutional arrangements for long-term care. The Netherlands, Germany, and Italy, representing distinct LTC regimes: Nordic, mixed, and family, provide a comparative context. Quality of life is measured using the CASP index and its domains (control, autonomy, self-realization, pleasure), along with overall life satisfaction. Key explanatory variables include four LTC dimensions: formal institutional care, formal home care, receiving help, and providing help. Models control for age, gender, physical and mental health, financial situation, education, marital status, GDP per capita, income inequality, and the COVID-19 period, treated as a natural experiment (“stress test”) for LTC systems. Regression mixed models were applied to analyze the overall relationships between LTC forms and quality of life and their variation across countries.
Results
Receiving help is associated with lower quality of life, particularly in control and self-realization, with stronger effects in Poland and Czechia than in Germany and the Netherlands, suggesting a higher burden of dependency where LTC relies more on family or has weaker formal support. Formal home care is also linked to lower CASP, especially in control. Institutional care shows no clear negative association after controls. A notable contrast emerges: providing help is positively associated with quality of life in Poland but negatively in Czechia. The strongest predictors remain physical and mental health and perceived financial situation.
Conclusions
Central and Eastern Europe is not homogeneous in how LTC relates to older adults’ quality of life. Poland and Czechia, despite similar regional classifications, exhibit distinct patterns of relationships between receiving and providing care and the well-being of older adults, indicating that LTC outcomes depend not only on formal care types but also on institutional, familial, and cultural contexts, and on whether help is experienced as support or dependence. Similar LTC forms may thus have different consequences across care regimes.
Keywords
long-term care: older adults’ quality of life: Poland: Czechia: SHARE
Cel
Celem referatu jest analiza poziomu i zróżnicowania satysfakcji z pracy wśród pracowników w wieku 50 lat i więcej w krajach europejskich po pandemii COVID-19. Badanie odpowiada na pytanie, w jakim stopniu zakłócenia wykonywania pracy w czasie pandemii – w tym praca zdalna oraz zmiany czasu pracy – były powiązane z oceną warunków pracy i satysfakcją zawodową starszych pracowników oraz jak satysfakcja ta różnicuje się między krajami.
Metody
Analiza oparta jest na danych z 9. rundy badania Survey of Health, Ageing and Retirement in Europe (SHARE), zrealizowanej w latach 2021–2022. Badanie ma charakter reprezentacyjny i obejmuje próbę losową osób w wieku 50+ w ponad 20 krajach europejskich oraz w Izraelu. W analizie uwzględniono 4?858 respondentów pozostających aktywnymi zawodowo w momencie realizacji badania. Satysfakcję z pracy oceniano na podstawie zestawu pytań dotyczących warunków pracy, obejmujących m.in. obciążenie fizyczne, presję czasu, autonomię, bezpieczeństwo zatrudnienia, możliwości rozwoju kompetencji, otrzymywane wsparcie i uznanie oraz adekwatność wynagrodzenia. W pierwszym etapie zastosowano analizę czynnikową w celu redukcji wymiarów, a następnie analizę skupień, pozwalającą na wyodrębnienie typów satysfakcji z pracy. W kolejnym etapie przeprowadzono wielomianową regresję logistyczną, identyfikując związki między przynależnością do wyróżnionych grup a cechami demograficznymi, poziomem wykształcenia oraz doświadczeniami zakłóceń pracy w czasie pandemii COVID-19, takimi jak praca zdalna czy zmiany czasu pracy. Wnioskowanie statystyczne oparto na estymacji parametrów i testach istotności, pozwalających na identyfikację charakterystyk związanych z przynależnością do określonej grupy wyodrębnionych pracowników.
Wyniki
Analiza skupień pozwoliła zidentyfikować cztery względnie podobne liczebnie grupy pracowników: osoby zmęczone fizycznie (26,8%), osoby niezadowolone z pracy (27,0%), osoby zniechęcone do pracy (25,2%) oraz osoby usatysfakcjonowane (20,9%). Oznacza to, że około 80% pracowników w wieku 50+ doświadcza ograniczonej satysfakcji z pracy, choć z różnych powodów. Stwierdzono istotne zróżnicowanie struktury tych grup pomiędzy krajami. Wyniki regresji wskazują, że zakłócenia pracy w czasie pandemii miały ograniczony wpływ na satysfakcję, jednak praca zdalna zmniejszała prawdopodobieństwo przynależności do grupy zmęczonej fizycznie. Wyższe wykształcenie i poczucie bezpieczeństwa w pracy istotnie zwiększały szanse bycia w grupie osób usatysfakcjonowanych.
Wnioski
Uzyskane wyniki wskazują, że po pandemii COVID-19 kluczowym wyzwaniem dla wydłużania aktywności zawodowej osób starszych pozostaje jakość pracy, a nie same zakłócenia pandemiczne. Niska satysfakcja z pracy silnie różnicuje sytuację pracowników 50+ między krajami i jest powiązana z niższymi wskaźnikami zatrudnienia w starszych grupach wieku. Poprawa warunków pracy, w tym ograniczenie obciążenia fizycznego oraz wzmocnienie uznania i bezpieczeństwa zatrudnienia, może stanowić istotny instrument polityki rynku pracy i aktywnego starzenia się
Słowa kluczowe:
satysfakcja z pracy: starsi pracownicy: COVID‑19: SHARE: rynek pracy
Pobierz prezentację (docx, 133 kB)Objective
The aim of this study is to examine the level and heterogeneity of job satisfaction among workers aged 50 and above in Europe in the post-COVID-19 period. The paper investigates whether disruptions to work during the pandemic, such as remote working and changes in working time, are associated with job satisfaction and how patterns of satisfaction differ across countries and socio-economic characteristics of older workers.
Methods
The analysis is based on data from Wave 9 (2021–2022) of the Survey of Health, Ageing and Retirement in Europe (SHARE), a cross-national, representative survey covering more than 20 European countries and Israel. The analytical sample includes 4,858 respondents aged 50 and above who were economically active at the time of the interview. Job satisfaction is assessed using a multidimensional set of indicators describing working conditions, including physical workload, time pressure, autonomy at work, job security, opportunities for skills development, recognition and support, as well as the perceived adequacy of earnings. All variables are harmonised across countries following SHARE methodological guidelines. In the first step, exploratory factor analysis is applied to identify latent dimensions underlying job satisfaction and to reduce the dimensionality of the observed indicators. Factor scores are subsequently used as inputs in a cluster analysis, which allows the identification of distinct and internally homogeneous job satisfaction profiles among older workers. In the final step, multinomial logistic regression models are estimated to examine the associations between cluster membership and individual characteristics such as age, gender, and educational attainment, as well as pandemic-related work disruptions, including the experience of remote working and changes in working hours during the COVID-19 period.
Results
Four job satisfaction profiles are identified: physically strained workers (26.8%), dissatisfied workers (27.0%), discouraged workers (25.2%), and satisfied workers (20.9%). Thus, around 80% of workers aged 50 and over experience limited job satisfaction, although for different reasons. The distribution of these profiles varies markedly across countries. Regression results indicate that pandemic-related work disruptions had a limited overall impact on job satisfaction, while remote working reduced the likelihood of belonging to the physically strained group. Higher educational attainment and greater perceived job security significantly increase the probability of being satisfied with one’s job.
Conclusions
The findings suggest that in the post-pandemic period the key challenge for extending working lives lies in job quality rather than in temporary pandemic-related disruptions. Low job satisfaction among older workers is widespread and strongly differentiated across countries. Policies aimed at improving working conditions, especially by reducing physical strain and strengthening job security and recognition, may play an important role in promoting longer and more sustainable employment among people aged 50 and above.
Keywords
job satisfaction: older workers: COVID‑19: SHARE: labour market
Cel
Celem referatu jest identyfikacja i analiza wyzwań kontroli ujawniania danych statystycznych prezentowanych w postaci macierzy przepływów (np. migracji wewnętrznych na pobyt stały, dojazdów do pracy, dojazdów do szkół). Główna hipoteza badawcza głosi, że publikacja tego rodzaju danych — w szczególności z ujawnieniem zerowych wartości przepływów — stanowi poważne ryzyko ujawnienia tych przekrojów, które w intencji autorów badania zostały ukryte (cell suppression). Dodatkowe udostępnianie danych dla wyższych poziomów podziału terytorialnego może zwiększyć ryzyko ujawnienia ukrytych informacji.
Metody
Badanie przeprowadzono na udostępnionych rzeczywistych danych statystyki publicznej, dotyczących migracji wewnętrznych na pobyt stały, pozyskanych z zasobów Głównego Urzędu Statystycznego (Baza Demografia). Analizą objęto przepływy na poziomie gmin, powiatów, podregionów i województw, co pozwoliło na ocenę zmian ryzyka ujawnienia w zależności od dostępności poziomu agregacji przestrzennej. Zastosowano metody z zakresu statystycznej kontroli ujawniania danych statystycznych (Statistical Disclosure Control, SDC), w tym analizę komórek wrażliwych według reguły dominacji (n, k), analizę komórek zerowych jako potencjalnych nośników informacji, a także badanie wzajemnych zależności między komórkami w macierzy. Zaproponowano formalizację problemu zerowych przepływów, wskazując na mechanizm, w którym agregacja do wyższych poziomów przestrzennych ujawnia dodatkowe informacje na temat przepływów na niższym poziomie agregacji danych. Osobno potraktowano problem niebezpiecznych zer, które — choć formalnie nieobecne w zbiorze komórek wrażliwych — mogą w połączeniu z wiedzą pomocniczą intruza prowadzić do naruszenia poufności danych na poziomie przepływów jednostkowych. W analizach wykorzystano autorskie programy napisane w języku R.
Wyniki
Przeprowadzona analiza na danych dotyczących międzygminnych migracji na pobyt udostępnionych w bazie Demografia stały wykazała, że zera w macierzy przepływów nie są informacyjnie neutralne — ich obecność jednoznacznie wskazuje na nieistnienie określonych relacji między jednostkami, co w połączeniu z dodatkowymi danymi zewnętrznymi może umożliwić pośrednią identyfikację ukrytych przekrojów. Co istotne, dostęp do pełnych danych na wyższym poziomie agregacji przestrzennej (powiaty, podregiony, województwa) zwiększa ryzyko ujawnienia: suma przepływów dla większych jednostek pozwala dodatkowo zrekonstruować dane na poziomie międzygminnym.
Wnioski
Wyniki wskazują na konieczność opracowania dedykowanych procedur metod kontroli ujawniana danych statystycznych dla danych prezentowanych w postaci macierzy przepływów. Procedury te powinny uwzględniać zarówno informacyjną rolę zer, jak i zależności hierarchiczne między poziomami agregacji przestrzennej. Istniejące standardy ochrony poufności w statystyce publicznej nie obejmują w wystarczającym stopniu specyfiki danych prezentowanych w postaci macierzy przepływów. Referat wskazuje kierunki dalszych prac.
Słowa kluczowe:
Kontrola ujawniania danych, macierze przepływów, zerowe przepływy, ukrywanie pierwotne, wykorzystanie danych zagregowanych
Pobierz prezentację (docx, 20 kB)Objective
The aim of the paper is to identify and analyse statistical disclosure control challenges for data presented as flow matrices (e.g. permanent internal migration, commuting to work, commuting to school). The main research hypothesis states that publishing such data — in particular with zero-valued flows disclosed — poses a serious risk of revealing cross-sections intended for suppression (cell suppression). The additional release of data at higher levels of territorial disaggregation may further increase this risk.
Methods
The study was conducted on real public statistics data concerning permanent internal migration, obtained from the resources of Statistics Poland (Demografia Database). The analysis covered flows at the level of communes, districts, subregions and voivodeships, allowing for a comprehensive assessment of how disclosure risk varies with the availability of different spatial aggregation levels. Methods from the field of Statistical Disclosure Control (SDC) were applied, including the analysis of sensitive cells based on the dominance rule (n, k), the analysis of zero cells as potential carriers of information, and the examination of interdependencies between cells within the matrix. A formalisation of the zero-flow problem was proposed, identifying the mechanism by which aggregation to higher spatial levels reveals additional information about flows at lower levels of data aggregation. The problem of dangerous zeros was treated separately — cells which, although formally absent from the set of sensitive cells, may in combination with an intruder`s auxiliary knowledge lead to a breach of data confidentiality at the level of individual flows. All analyses were carried out using custom programs written in the R language.
Results
The analysis conducted on data concerning inter-communal permanent migration, available in the Demografia database, demonstrated that zeros in the flow matrix are not informationally neutral — their presence unambiguously indicates the absence of specific relations between units, which in combination with additional external data may enable the indirect identification of suppressed cells. Importantly, access to complete data at a higher level of spatial aggregation (districts, voivodeships) increases the disclosure risk: the aggregated flows for larger territorial units allow for the additional reconstruction of data at the inter-communal level.
Conclusions
The results indicate the need to develop dedicated statistical disclosure control procedures for data presented in the form of flow matrices. Such procedures should account for both the informational role of zeros and the hierarchical dependencies between spatial aggregation levels. Existing confidentiality protection standards in official statistics do not sufficiently address the specific characteristics of data presented as flow matrices. The paper outlines possible directions for further research.
Keywords
statistical disclosure control, flow matrices, zero flows, primary suppression, aggregated data utilization.
Cel
Celem projektu LabFam Individual Biographies jest zwiększenie reprodukowalności i porównywalności badań z zakresu nauk społecznych poprzez stworzenie otwartej, zharmonizowanej bazy biografii rodzinnych i zawodowych. Badanie odpowiada na pytanie, w jaki sposób można odtworzyć spójne przebiegi płodności, partnerstwa i zatrudnienia w pięciu długookresowych panelach tak, aby umożliwić analizy przebiegu życia w ujęciu międzynarodowym.
Metody
Badanie opiera się na harmonizacji danych z pięciu wieloletnich badań panelowych: HILDA (Australia), SOEP (Niemcy), SHP (Szwajcaria), BHPS / UKHLS (Wielka Brytania) oraz PSID (USA). Dla każdej bazy odtworzono indywidualne biografie w trzech domenach: dzietności, partnerstwa i zatrudnienia. Wykorzystano dane z kwestionariuszy głównych, modułów kalendarzowych oraz komponentów retrospektywnych, co pozwoliło odzyskać zdarzenia zachodzące między falami badania i przed wejściem respondenta do panelu. Wyniki zapisano w postaci datowanych epizodów ze zdefiniowanym początkiem i końcem, umożliwiających analizy trwania i przejść między stanami. Harmonizacja obejmowała ujednolicenie definicji zmiennych, rozstrzyganie konfliktów między źródłami oraz wybór informacji najbliższej czasowo badanemu epizodowi. W obszarze zatrudnienia przyjęto wspólną klasyfikację statusów rynku pracy, a dla nakładających się informacji stosowano hierarchię stanów. Cały proces zaimplementowano w języku R jako otwarty, modułowy kod, który użytkownik może odtworzyć, dostosować do wybranych krajów, okresów i domen oraz łączyć z innymi infrastrukturami, np. CPF / CNEF. Procedury walidacyjne obejmowały porównania z miarami wyznaczanymi z badań źródłowych oraz z zewnętrznymi statystykami demograficznymi i rynku pracy.
Wyniki
W efekcie powstała otwarta infrastruktura danych umożliwiająca rekonstrukcję porównywalnych, indywidualnych historii płodności, partnerstwa i zatrudnienia dla pięciu krajów. Walidacja wewnętrzna i zewnętrzna pokazała wysoką zgodność wskaźników wyprowadzonych z LIB z danymi referencyjnymi, m.in. dla bezdzietności, wieku przy urodzeniu dziecka, wieku przy pierwszym małżeństwie oraz aktywności zawodowej kobiet i mężczyzn. Niewielkie odchylenia dotyczyły głównie wybranych kohort i baz, co potwierdza ogólną rzetelność oraz porównywalność zharmonizowanych biografii. Największą zgodność obserwowano dla SOEP, SHP oraz BHPS / UKHLS, natomiast większe różnice pojawiały się przede wszystkim w PSID oraz w najmłodszych lub najstarszych kohortach.
Wnioski
LIB obniża koszty przygotowania danych do analiz porównawczych i wzmacnia transparentność badań nad przebiegiem życia. Otwarty kod umożliwia pełną reprodukcję wyników, kontrolę decyzji harmonizacyjnych i dalsze rozwijanie bazy przez użytkowników. Projekt wnosi do literatury narzędzie pozwalające łączyć perspektywę rodzinną i zawodową w analizach międzynarodowych oraz ułatwia badanie zależności między niepewnością zatrudnienia, formowaniem związków, rodzicielstwem i wycofywaniem się z rynku pracy.
Słowa kluczowe:
harmonizacja danych, reprodukowalność badań
Pobierz prezentację (docx, 18 kB)Objective
The LabFam Individual Biographies project aims to enhance reproducibility and comparability in social science research by developing an open, harmonized database of family and employment biographies. It focuses on reconstructing consistent fertility, partnership, and employment trajectories across five long-running panel surveys. By integrating multiple data sources and aligning life-course information across countries, the project enables robust cross-national analyses of life-course dynamics.
Methods
The study is based on the harmonization of data from five long-running panel surveys: HILDA (Australia), SOEP (Germany), SHP (Switzerland), BHPS / UKHLS (United Kingdom), and PSID (United States). For each dataset, individual biographies were reconstructed in three domains: fertility, partnership, and employment. Data from core questionnaires, calendar modules, and retrospective components were used to recover events occurring between survey waves and prior to panel entry. The results are stored as dated spells with clearly defined starts and ends, enabling analyses of durations and transitions between states. Harmonization included standardizing variable definitions, resolving inconsistencies across sources, and prioritizing information closest in time to the observed episode. In the employment domain, a common classification of labor market statuses was applied, and overlapping information was resolved using a hierarchical ordering of states. The entire process was implemented in R as open, modular code that users can reproduce, customize by country, period, and domain, and link to other infrastructures such as CPF / CNEF. Validation procedures included comparisons with indicators derived from source surveys and external demographic and labor market statistics.
Results
The project resulted in an open data infrastructure enabling the reconstruction of comparable individual histories of fertility, partnership, and employment across five countries. Internal and external validation showed a high level of consistency between LIB-derived indicators and benchmark data, including measures of childlessness, age at childbirth, age at first marriage, and labor force participation of women and men. Minor discrepancies were mainly limited to specific cohorts and datasets, confirming the overall reliability and comparability of the harmonized biographies. The highest consistency was observed for SOEP, SHP, and BHPS / UKHLS, while larger deviations appeared primarily in PSID and in the youngest or oldest cohorts.
Conclusions
LIB reduces the costs of data preparation for comparative analyses and enhances transparency in life-course research. Its open-source and modular code ensures full reproducibility, makes harmonization decisions explicit, and allows users to adapt and extend the framework to their needs. By providing harmonized, spell-based histories, the project offers a tool that integrates family and employment perspectives in cross-national analyses and supports research on the interplay between employment uncertainty, partnership formation, childbearing, and labor market withdrawal.
Keywords
data harmonization, research reproducibility
Cel
Badanie aktywności ekonomicznej ludności spotyka się w trakcie swojej realizacji z nowymi wyzwaniami, oczekiwaniami i wymaganiami. Wynikają one ze zmian potrzeb oraz oczekiwań użytkowników, wymagań regulowanych przez przepisy prawne (np. nowe rozporządzenie ramowe dotyczące europejskiej statystyki społecznej), jak również okoliczności realizacji badania (np. pandemia COVID-19). Referat przedstawia zmiany w sposobie wyznaczania wag uogólniających BAEL wprowadzane od 2020 roku do chwili obecnej, których motywacja dotyczy wszystkich wspomnianych wyżej czynników.
Metody
Prezentowane działania, mające na celu sprostanie przedstawionym wyżej wyzwaniom, dotyczą zmian w sposobie wyznaczania wag uogólniających. Podstawową metodą jest kalibracja – metody oraz warunki kalibracyjne zostały zmienione na bardziej adekwatne lub wprowadzono kalibrację tam, gdzie nie była dotąd stosowana. Jeśli idzie o wagi indywidualne, zmiana polegała przede wszystkim na przejściu z post-stratyfikacji na bardziej ogólną kalibrację, co pozwoliło uwzględnić więcej warunków kalibracyjnych, m.in. lepiej odpowiadając na potrzeby użytkowników. Warunki kalibracyjne zostały rozszerzone w zakresie oszacowań regionalnych. Wprowadzono warunki dotyczące tygodnia referencyjnego, poprawiając reprezentatywność w czasie, co jest szczególnie istotne w przypadku nierównomiernie rozłożonych w kwartale zakłóceń realizacji wywiadów (jak to miało miejsce w pandemii). W przypadku wag gospodarstw domowych specyficznym problemem są konsekwencje akceptowania w badaniu częściowych jednostkowych braków odpowiedzi, tj. sytuacji, gdy odmowa udziału w wywiadzie indywidualnym dotyczy części członków gospodarstwa domowego. Wagi były wcześniej wyznaczane jako średnia wag członków gospodarstw i nie pozwalały na uzyskanie uogólnień spójnych z uogólnieniami indywidualnymi. Zmieniono sposób traktowania niepełnych wywiadów przy wyznaczaniu wag gospodarstw oraz wprowadzono kalibrację, która zapewnia zgodność z uogólnieniami indywidualnymi.
Wyniki
Wprowadzenie uogólnionej kalibracji wag indywidualnych pozwoliło zapewnić kontrolowaną jakość uogólnień w zakresie większej liczby przekrojów odpowiadających potrzebom użytkowników, unikając jednocześnie problemów z liczebnością próby w zbyt małych warstwach post-stratyfikacyjnych, co negatywnie rzutowało na stabilność wag i jakość uogólnień. Zastosowanie warunków dotyczących tygodnia referencyjnego zapewnia równą reprezentację wszystkich tygodni kwartału i eliminuje wrażliwość wyników na zmienność wielkości próby zrealizowanej w poszczególnych tygodniach (potencjalne obciążenie). Osiągnięto spójność oszacowań uzyskiwanych przy użyciu wag gospodarstw domowych z oszacowaniami indywidualnymi w zakresie podstawowych przekrojów, w tym dotyczących statusu aktywności ekonomicznej.
Wnioski
Zmiany metodologiczne pozwoliły spełnić wymogi wynikające z rozporządzenia ramowego oraz oczekiwań Euorstatu (przede wszystkim w odniesieniu do wag i uogólnień dotyczących gospodarstw domowych), poprawić jakość danych wynikowych oraz ich użyteczność z punktu widzenia potrzeb użytkowników. Zamiana w sposobie wyznaczania wag gospodarstw domowych ułatwia prowadzenie analiz, które wymagają uwzględnienia powiazań między członkami gospodarstwa, a także poprawia spójność ich wyników. Rozwiązania dotyczące kalibracji ze względu na tydzień referencyjny (czas) lub postępowania z niekompletnymi wywiadami gospodarstwa domowego mogą znaleźć szersze zastosowanie.
Słowa kluczowe:
aktywność ekonomiczna ludności, BAEL, wagi uogólniające, estymacja, kalibracja
Pobierz prezentację (docx, 19 kB)Objective
The Polish Labour Force Survey (BAEL) is facing new challenges, expectations, and requirements. These stem from changing user needs and expectations, legal requirements (e.g., the new framework regulation on European social statistics), and the circumstances of fieldwork (e.g., the COVID-19 pandemic). The paper presents the changes to the way of calculation of estimation weights in the Polish LFS implemented from 2020 to the present, driven by all the factors mentioned above.
Methods
The presented actions, aimed at addressing the challenges mentioned above, involve changes in the methodology of weighting (estimation). The primary method is a calibration – calibration methods and conditions have been changed to more appropriate ones, or calibration has been introduced where it was not previously used. Regarding individual weights, the change primarily involved a shift from a simple post-stratification to a general calibration, which allowed for the inclusion of more calibration conditions to, among other things, better meet user needs. Calibration conditions have been expanded for regional estimates. Reference week conditions have been introduced, improving representativeness over time, which is particularly important in the case of unevenly distributed in time disturbances in the interviewing process (as was the case during the pandemic). In the case of household weights, a specific problem is the consequence of accepting partial unit non-responses in the survey, i.e., situations where the refusal to participate in an individual interview concerns some household members. Household weights were previously calculated as an average of household member weights and did not allow for estimates consistent with the individual estimates. The treatment of incomplete interviews in calculating household weights has been changed, and a calibration has been introduced to ensure consistency with the individual estimates.
Results
The introduction of general calibration for calculating individual weights allowed for controlled quality of estimates for a larger number of cross-sections meeting user needs, while also avoiding sample size problems in too small post-stratification strata, which negatively impacted the stability of the weights and the quality of estimates. The use of reference week based conditions ensures equal representation of all weeks of the quarter and eliminates the sensitivity of the results to variations in sample size across weeks (potential bias). Consistency was achieved between the estimates obtained using household weights and individual estimates for the basic cross-sections, including economic activity status.
Conclusions
The methodological changes allowed us to meet the requirements of the framework regulation and Eurostat`s expectations (primarily regarding weights and estimates for households), improve the quality of results, and enhance their usefulness for user needs. The change in the calculation of household weights facilitates analyses that require consideration of relationships between household members and improves the consistency of their results. The solutions for calibration with respect to reference week (time) or for dealing with incomplete household interviews may find wider application.
Keywords
Labour Force Survey, weighting, estimation, calibration
Cel
Celem badania jest identyfikacja ukrytych czynników determinujących lata życia w zdrowiu (HLY) w wybranych krajach Unii Europejskiej oraz ocena, w jakim stopniu kierunki maksymalnej zmienności determinant zdrowotnych pokrywają się z kierunkami o najwyższej mocy predykcyjnej dla HLY. Zasadnicze pytanie badawcze brzmi: Czy nadzorowana redukcja wymiarów (PLS) daje przewagę nad nienadzorowaną (PCR) w warunkach silnej współliniowości i ograniczonej liczby obserwacji panelowych?
Metody
Zastosowano dwie metody redukcji wymiarów: regresję składowych głównych (PCR) oraz regresję częściowych najmniejszych kwadratów (PLS). PCR jest procedurą nienadzorowaną, w której dekompozycję spektralną macierzy korelacji zmiennych objaśniających poprzedza estymacja OLS na wybranych składowych. PLS, w odróżnieniu od PCR, maksymalizuje kowariancję między X a Y (algorytm NIPALS), co czyni ją metodą nadzorowaną. Próba liczy 120 obserwacji panelowych: 6 krajów (Austria, Dania, Niemcy, Włochy, Polska, Hiszpania) × 2 płcie × 10 lat (2015-2024). Zmienna zależna (HLY) i 10 determinant zdrowotnych (zanieczyszczenie powietrza, edukacja, deprywacja materialna, wydatki socjalne, gęstość zaludnienia, łóżka szpitalne, lekarze, alkohol, palenie, otyłość) pochodzą z Eurostatu, Banku Światowego i WHO. Liczbę składowych dobrano kryterium Kaisera, analizą równoległą Horna oraz walidacją krzyżową LOOCV minimalizującą RMSEP. Adekwatność próby do PCA potwierdzono testami KMO i Bartletta. Modele rozszerzono o efekty stałe dla krajów oraz zmienną binarną COVID-19. Porównanie metod oparto na: (a) RMSEP z LOOCV, (b) sparowanym teście różnic kwadratów reszt (typu Diebolda–Mariano), (c) korelacji ładunków PCA z wagami PLS, (d) bootstrapowych przedziałach ufności (B=500). Obliczenia wykonano w R z pakietami pls, psych, factoextra i car.
Wyniki
PCR osiąga RMSEP=2,872 przy 7 składowych, podczas gdy PLS uzyskuje porównywalne RMSEP=2,856 już przy 2 składowych. Test sparowany różnic kwadratów reszt nie wykazał istotnych różnic predykcyjnych (p=0,925). Niska korelacja ładunków PCA i wag PLS (r=0,262) potwierdza, że kierunki maksymalnej wariancji X nie pokrywają się z kierunkami o najwyższej mocy predykcyjnej. W modelu PCR z efektami stałymi istotne są dopiero PC5 i PC6 (nie PC1–PC3 absorbujące 73,9% wariancji). PCR+FE: R2=0,803 przy 14 parametrach: PLS+FE: R2=0,762 przy 9. Bootstrap (B=500) potwierdził istotność 8 z 10 współczynników PLS.
Wnioski
Wyniki wskazują, że przy silnej współliniowości i ograniczonym stosunku n / p metoda PLS oferuje przewagę parsymoniczną nad PCR, osiągając porównywalną dokładność predykcyjną przy 3,5-krotnie mniejszej liczbie składowych. Podejście panelowe (pooled) eliminuje niestabilność estymacji typową dla analiz per-country (n / p=1:1). Zidentyfikowano odmienne profile determinant HLY: u mężczyzn dominują czynniki behawioralno-środowiskowe, u kobiet socjoekonomiczne. Wkładem do literatury jest formalne porównanie PCR i PLS na panelowych danych HLY oraz wykazanie, że standardowe kryteria selekcji składowych (Kaiser, Horn) mogą być nieoptymalne dla celów predykcyjnych.
Słowa kluczowe:
lata życia w zdrowiu (HLY): regresja na składowych głównych (PCR): regresja częściowych najmniejszych kwadratów (PLS): redukcja wymiarów: dane panelowe
Pobierz prezentację (docx, 20 kB)Objective
The aim of the study is to identify the latent factors determining Healthy Life Years (HLY) in selected European Union countries and to assess the extent to which the directions of maximum variability in the set of health determinants coincide with the directions of highest predictive power for HLY. The central research question is: does supervised dimension reduction (PLS) offer an advantage over unsupervised reduction (PCR) under conditions of strong multicollinearity and a limited number of panel observations?
Methods
Two dimension reduction methods are applied: Principal Component Regression (PCR) and Partial Least Squares Regression (PLS). PCR is an unsupervised procedure in which a spectral decomposition of the correlation matrix of explanatory variables precedes OLS estimation on the selected components. PLS, in contrast to PCR, maximises the covariance between X and Y (NIPALS algorithm), which makes it a supervised method. The sample comprises 120 panel observations: 6 countries (Austria, Denmark, Germany, Italy, Poland, Spain) × 2 sexes × 10 years (2015-2024). The dependent variable (HLY) and 10 health determinants (air pollution, education, material deprivation, social protection expenditure, population density, hospital beds, physicians, alcohol consumption, smoking, obesity) are drawn from Eurostat, the World Bank and WHO. The number of components is selected via the Kaiser criterion, Horn`s parallel analysis and Leave-One-Out Cross-Validation (LOOCV) minimising RMSEP. Sample adequacy for PCA is confirmed by KMO and Bartlett tests. The models are extended with country fixed effects and a binary COVID-19 dummy. Method comparison is based on: (a) LOOCV RMSEP, (b) a paired test on squared LOO residuals (Diebold–Mariano style), (c) the correlation between PCA loadings and PLS weights, (d) bootstrap confidence intervals (B=500). All computations are performed in R using the pls, psych, factoextra and car packages.
Results
PCR attains RMSEP=2.872 with 7 components, while PLS achieves a comparable RMSEP=2.856 with only 2 components. The paired test on squared residuals reveals no significant difference in predictive accuracy (p=0.925). The low correlation between PCA loadings and PLS weights (r=0.262) confirms that the directions of maximum variance in X do not coincide with the directions of highest predictive power. In the PCR model with fixed effects, only PC5 and PC6 are significant (not PC1–PC3, which absorb 73.9% of the variance). PCR+FE: R2=0.803 with 14 parameters: PLS+FE: R2=0.762 with 9. Bootstrap (B=500) confirmed the significance of 8 out of 10 PLS coefficients.
Conclusions
The results indicate that under strong multicollinearity and a limited n / p ratio, PLS offers a clear parsimony advantage over PCR, attaining comparable predictive accuracy with 3.5 times fewer components. The pooled panel approach eliminates the estimation instability typical of per-country analyses (n / p=1:1). Distinct profiles of HLY determinants are identified: behavioural-environmental factors dominate for men, while socio-economic factors prevail for women. The contribution to the literature is a formal comparison of PCR and PLS on panel HLY data and the demonstration that standard component selection criteria (Kaiser, Horn) may be suboptimal for predictive purposes.
Keywords
Healthy Life Years (HLY): Principal Component Regression (PCR): Partial Least Squares (PLS): dimension reduction: panel data
Cel
Charakterystyka pomiaru ubóstwa ekonomicznego w Polsce, z uwzględnieniem następujących kwestii: 1. Punkty odniesienia stosowanych miar obiektywnych ubóstwa ekonomicznego 2. Interpretacja głównych wskaźników ubóstwa ekonomicznego i niedostatku 3. Źródła danych pozwalające na szacowanie ubóstwa ekonomicznego i niedostatku w Polsce. 4. Dynamika zmian różnych typów ubóstwa ekonomicznego, niedostatku i ocen subiektywnych sytuacji materialnej 5. Jakie skale w odpowiedziach na pytania o ocenę subiektywną sytuacji materialną: 6. Ubóstwo a rozumienie spójności społecznej
Metody
Metoda analityczno - syntetyczna publikacji dotyczących badań Głównego Urzędu Statystycznego z których pochodzą dane w oparciu o które szacowane jest ubóstwo ekonomiczne oraz obserwacja uczestnicząca w procesie badawczym dotyczącym ubóstwa i wykluczenia społecznego prowadzonym przez Główny Urząd statystyczny. Źródłami danych na których oparto szacowanie ubóstwa ekonomicznego są wyniki następujących badań reprezentacyjnych realizowanych przez Statystykę Polską: corocznego Badania Budżetów Gospodarstw Domowych (próba - ok 30-35 tys. gospodarstw domowych), corocznego Europejskiego Badania Warunków Życia Ludności (ok. 14 tys. gospodarstw domowych) oraz cyklicznego (co kilka lat, ostatnia edycja badania w 2018 roku) Badania Spójności Społecznej (dotychczasowa próba badawcza - ok. 25-26 tys. gospodarstw domowych). Narzędziami badawczymi tych badań są kwestionariusze ankiet. W szacowaniu zasięgu zagrożenia ubóstwem ekonomicznym dominuje podejście wydatkowe (dotyczy zagrożenia ubóstwem skrajnym, relatywnym wydatkowym oraz ustawowym (które szacowane są w oparciu o wydatki miesięczne na dobra i usługi łącznie z funduszem remontowym na podstawie Badania Budżetów Gospodarstw Domowych ) nad dochodowym (które szacowane jest w oparciu o dochody roczne w oparciu o dane pochodzące z EU-SILC oraz Badania Spójności Społecznej).
Wyniki
1. Zasięgi zagrożenia poszczególnych typów ubóstwa ekonomicznego szacowanego w Polsce i kierunki ich zmian w czasie są różne z uwagi na różne interpretacje znaczeniowe tych typów 2. Kierunki zmian ubóstwa skrajnego i niedostatku pokrywają się (konstrukcje obu wskaźników są podobne do siebie) 3. Kierunki zmian w zasięgach ubóstwa skrajnego a oceny złej i bardzo złej sytuacji materialnej mogą mieć przeciwną dynamikę 4. W ocenach subiektywnych na potrzeby krajowe stosuje się skalę Likerta zamiast np. 10 - stopniowych skal jakie stosuje EUROSTAT 5. Ubóstwo było jednym z elementów diagnozy w Badaniu Spójności Społecznej co wynikało z rozumienia Spójności społecznej przyjętego przez Statystykę Polską, co wybiega poza ramy definicyjne spójności zaproponowanych przez UNECE.
Wnioski
1. W badaniu ubóstwa jako zjawiska wielowymiarowego Statystyka Polska wykorzystuje relatywnie szeroki wachlarz miar obiektywnych w szacowaniu ubóstwa ekonomicznego oraz uzupełniająco stosuje także oceny subiektywne. 2. Każda miara ma różną interpretację i z metodologicznego punktu widzenia nie ma podstaw aby preferować którąś z nich. 3. W uzupełnieniu do stosowanych miar odnoszących się do ubóstwa ekonomicznego warto wprowadzić miarę uwzględniającą posiadane zasoby możliwe do szybkiego upłynnienia. . Zastosowanie wskaźnika obejmującego takie zasoby dałoby możliwość pełniejszego obrazu ubóstwa. Progi ubóstwa ustawowego powinny być ustalane częściej (a nie średnio raz na trzy lata).
Słowa kluczowe:
zagrożenie ubóstwem skrajnym, relatywnym i ustawowym, zagrożenie niedostatkiem, podejście wydatkowe i dochodowe,
Pobierz prezentację (docx, 16 kB)Objective
Characteristics of the measurement of economic poverty in Poland, taking into account the following issues: 1. Benchmarks for the objective measures of economic poverty used 2. Interpretation of the main indicators of economic poverty and privation 3. Data sources enabling the estimation of economic poverty and privation in Poland. 4. Trends in various types of economic poverty, privation and subjective assessments of financial circumstances 5. What scales are used in responses to questions regarding the subjective assessment of financial circumstances 6. Poverty and the social Cohesion
Methods
An analytical and synthetic approach to publications on research conducted by the Statistics Poland, from which the data used to estimate economic poverty are derived, as well as participant observation in the research process on poverty and social exclusion carried out by the Statistics Poland. The data sources on which the estimation of economic poverty is based are the results of the following representative surveys carried out by Statistics Poland: the annual Household Budget Survey (sample – approx. 30–35,000 households), the annual European Survey on the Living Conditions of the Population (approx. 14,000 households) and the periodic (every few years, with the latest edition of the survey in 2018) Social Cohesion Survey (current sample size – approx. 25–26,000 households). The research tools used in these surveys are questionnaires. The expenditure-based approach predominates in estimating the extent of the risk of economic poverty (this applies to the risk of extreme poverty, relative expenditure-based and legal poverty (which are estimated based on monthly expenditure on goods and services, including the renovation fund, using data from the Household Budget Survey) over the income-based approach (which is estimated based on annual income using data from EU-SILC and the Social Cohesion Survey).
Results
1. The ranges of risk associated with various types of economic poverty estimated in Poland, and the trends in these ranges over time, differ due to varying interpretations of the meaning of these types 2. The trends in extreme poverty and privation coincide (the constructs of both indicators are similar) 3. Trends in the prevalence of extreme poverty and assessments of a poor and very poor financial situation may show opposite dynamics 4. In subjective assessments for national purposes, a Likert scale is used instead of, for example, the 10-point scales used by Eurostat 5. Poverty was one of the elements of the analysis in the Social Cohesion Survey, which stemmed from the understanding of social cohesion adopted by Polish Statistics. UNECE ignores aspect of poverty in social cohesion.
Conclusions
1. In its study of poverty as a multidimensional phenomenon, Statistics Poland uses a relatively wide range of objective measures to estimate economic poverty and, as a supplement, also employs subjective assessments. 2. Each measure has a different interpretation and, from a methodological point of view, there is no basis for favouring any one of them. 3. In addition to the measures used to assess economic poverty, it would be worthwhile to introduce a measure that takes into account assets that can be quickly liquidated. The use of an indicator covering such assets would provide a more comprehensive picture of poverty. Legal poverty thresholds should be set more frequently than 3 years.
Keywords
the risk of extreme, relative and legal poverty: the risk of privation: the expenditure-based and income-based approaches:
Cel
Celem referatu jest prezentacja wyników estymacji wskaźnika zagrożenia ubóstwem (AROP) w Polsce w przekroju podregionów (NUTS 3) za lata 2019-2023 z wykorzystaniem jednowymiarowego (UFH) i wielowymiarowego (MFH) modelu Fay`a-Herriota. Badanie zrealizowano w ramach współpracy Uniwersytetu Ekonomicznego w Poznaniu, Głównego Urzędu Statystycznego, Urzędu Statystycznego w Poznaniu z Bankiem Światowym. Zastosowanie metod statystyki małych obszarów ma na celu dostarczenie precyzyjnych ocen ubóstwa na niższym poziomie agregacji przestrzennej niż dotychczas publikowany przez statystykę publiczną.
Metody
Badaniem objęto wszystkie 73 podregiony (NUTS 3) w Polsce za lata 2019-2023. Bezpośrednie oceny AROP uzyskano na podstawie próby z badania EU-SILC realizowanego przez GUS, którego liczebność i schemat doboru nie pozwalają na publikację wiarygodnych szacunków poniżej poziomu województw. W modelach Fay`a-Herriota jako zmienną objaśnianą wykorzystano bezpośrednie oceny AROP, a jako zmienne pomocnicze cechy z Banku Danych Lokalnych GUS opisujące strukturę demograficzną, sytuację na rynku pracy, migracje, dochody oraz infrastrukturę mieszkaniową (rozważano zestawy 6 i 9 zmiennych pomocniczych). W modelu UFH wykorzystano empiryczny najlepszy liniowy nieobciążony predyktor (EBLUP), będący ważoną kombinacją estymatora bezpośredniego i syntetycznego. Wielowymiarowy model Fay`a-Herriota (MFH) rozszerza ujęcie jednowymiarowe poprzez jednoczesne uwzględnienie wektora skorelowanych charakterystyk obszarowych, co pozwala wykorzystać korelacje pomiędzy AROP a zmiennymi pomocniczymi w celu poprawy precyzji ocen. Wartości parametrów modeli oszacowano metodą największej wiarogodności z ograniczeniami (REML), a jakość uzyskanych ocen oceniono za pomocą współczynnika zmienności (CV) oraz porównano z precyzją ocen bezpośrednich.
Wyniki
Mapy ubóstwa wykazują wyraźne zróżnicowanie przestrzenne AROP w Polsce: wyższe wartości obserwowane są w Polsce centralnej i wschodniej, niższe w Polsce zachodniej, a najniższe w dużych miastach i podregionach je otaczających. Oceny uzyskane na podstawie modeli UFH i MFH charakteryzują się większą precyzją niż oceny bezpośrednie - współczynniki zmienności (CV) są zauważalnie niższe w całym analizowanym okresie 2019-2023. Modele UFH bazujące na 6 i 9 zmiennych pomocniczych prowadzą do zbliżonych wyników, a zastosowanie MFH dodatkowo poprawia jakość ocen poprzez wykorzystanie korelacji między cechami obszarowymi, dostarczając spójnego obrazu zróżnicowania ubóstwa w Polsce.
Wnioski
Zastosowanie modeli Fay’a-Herriota umożliwia szacowanie wskaźnika AROP na poziomie 73 podregionów (NUTS 3), dla których wyniki nie były publikowane przez statystykę publiczną w Polsce. MFH stanowi rozszerzenie podejścia UFH i pozwala na efektywne wykorzystanie informacji pochodzących z wielu skorelowanych charakterystyk obszarowych. Wyniki badania, zrealizowanego we współpracy z Bankiem Światowym, mogą być wykorzystane przy projektowaniu polityki spójności i alokacji środków rozwojowych. Zaproponowane podejście jest transferowalne na inne obszary statystyki publicznej, w których istnieje potrzeba estymacji na niskich poziomach agregacji przestrzennej.
Słowa kluczowe:
statystyka małych obszarów, model Fay’a-Herriota, wielowymiarowy model Fay’a-Herriota, wskaźnik zagrożenia ubóstwem (AROP), mapy ubóstwa
Pobierz prezentację (docx, 18 kB)Objective
The aim of this paper is to present the results of the estimation of the at-risk-of-poverty rate (AROP) in Poland at the subregion level (NUTS 3) for 2019–2023, using univariate (UFH) and multivariate (MFH) Fay-Herriot models. The study was carried out in cooperation between the Poznań University of Economics and Business, Statistics Poland, the Statistical Office in Poznań, and the World Bank. Small area estimation methods are applied to provide precise poverty estimates at a lower level of spatial aggregation than that previously published by official statistics.
Methods
The study covered all 73 subregions (NUTS 3) in Poland for the years 2019–2023. Direct estimates of AROP were obtained on the basis of the sample from the EU-SILC survey conducted by Statistics Poland, whose sample size and sampling design do not allow for the publication of reliable estimates below the regional level (provinces). In the Fay-Herriot models, the direct estimates of AROP were used as the dependent variable, while the auxiliary variables were taken from the Local Data Bank of Statistics Poland (BDL GUS) and described the demographic structure, the situation on the labour market, migration, income, and housing infrastructure (sets of 6 and 9 auxiliary variables were considered). In the UFH model, the empirical best linear unbiased predictor (EBLUP) was applied, which is a weighted combination of the direct and synthetic estimators. The multivariate Fay-Herriot (MFH) model extends the univariate approach by simultaneously taking into account a vector of correlated area-specific characteristics, which makes it possible to exploit the correlations between AROP and the auxiliary variables in order to improve the precision of the estimates. The model parameters were estimated by means of restricted maximum likelihood (REML), and the quality of the obtained estimates was assessed using the coefficient of variation (CV) and compared with the precision of the direct estimates.
Results
The poverty maps reveal a pronounced spatial variation of AROP in Poland: higher values are observed in central and eastern Poland, lower values in western Poland, and the lowest values in large cities and the subregions surrounding them. The estimates obtained on the basis of the UFH and MFH models are characterised by greater precision than the direct estimates: the coefficients of variation (CV) are noticeably lower throughout the entire analysed period of 2019-2023. The UFH models based on 6 and 9 auxiliary variables lead to similar results, while the application of MFH additionally improves the quality of the estimates by exploiting the correlations between area-specific characteristics, providing a coherent picture of the spatial differentiation of poverty in Poland.
Conclusions
The application of Fay-Herriot models makes it possible to estimate the AROP indicator at the level of 73 subregions (NUTS 3), for which results have not previously been published by official statistics in Poland. MFH constitutes an extension of the UFH approach and allows for the effective use of information derived from multiple correlated area-specific characteristics. The results of the study, carried out in cooperation with the World Bank, may be applied in the design of cohesion policy and the allocation of development funds. The proposed approach is transferable to other areas of official statistics in which there is a need for estimation at low levels of spatial aggregation.
Keywords
small area estimation, Fay-Herriot model, multivariate Fay-Herriot model, at-risk-of-poverty rate (AROP), poverty maps
Cel
Głównym celem badania jest opracowanie metodologii wielowymiarowej analizy ubóstwa energetycznego, opartej na analizie wskaźników energetycznych oraz wspartej danymi pozaenergetycznymi. Problem badawczy koncentruje się na stworzeniu zintegrowanego zestawu wskaźników łączących aspekty techniczne, ekonomiczne i społeczne, co pozwala na precyzyjniejszą diagnozę zjawiska niż dotychczasowe pojedyncze miary. Analizie poddano okres 2018-2024.
Metody
W badaniu wykorzystano dane pochodzące z Badania Budżetów Gospodarstw Domowych (BBGD), realizowanego przez Główny Urząd Statystyczny na próbie około 32 tys. gospodarstw domowych (dane za 2024 r.). Źródło to stanowi reprezentatywną bazę informacji o wydatkach, dochodach i warunkach życia, co zapewnia wysoką wiarygodność prowadzonych analiz. Opracowanie obejmuje całą populację gospodarstw ujętych w badaniu, dzięki czemu możliwe jest formułowanie wniosków o charakterze ogólnokrajowym oraz identyfikacja zróżnicowania społecznego i przestrzennego. Na podstawie danych źródłowych wyznaczono zestaw wskaźników ubóstwa energetycznego odzwierciedlających zarówno aspekty ekonomiczne, jak i jakościowe związane z użytkowaniem energii oraz subiektywną oceną warunków mieszkaniowych. Kolejnym etapem była analiza nakładania się wskaźników, pozwalająca na identyfikację gospodarstw dotkniętych wielowymiarowym ubóstwem energetycznym oraz ocenę współwystępowania różnych form deprywacji na rynku energii. W dalszej części zastosowano metody taksonomiczne, w tym metody Hellwiga, Webera i TOPSIS, a także analizę głównych składowych (PCA). Do obu podejść włączono również dane pozaenergetyczne, co umożliwiło bardziej precyzyjną klasyfikację gospodarstw, redukcję wymiarowości oraz identyfikację czynników najlepiej różnicujących poziom ubóstwa energetycznego
Wyniki
Badanie wykazało, że modyfikacja szczegółowości pytań w BBGD w 2020 r., wpływających na wskaźnik LEAKS, przyczyniła się do zauważalnego spadku jego wartości w skali kraju. Jednocześnie obserwacje z 2024 r. wskazały na wzrost wybranych wskaźników niefinansowych w województwach dotkniętych powodzią, co sugeruje wrażliwość tych miar na nagłe zdarzenia kryzysowe. Zastosowanie analizy nakładania wskaźników ubóstwa energetycznego umożliwiło wizualizację intensywności zjawiska. Metody taksonomiczne pozwoliły uchwycić kierunek i skalę zmian sytuacji gospodarstw domowych, zaś analiza PCA ułatwiła identyfikację kluczowych czynników wpływających na poziom ubóstwa energetycznego. Wyniki podkreślają złożoność problemu oraz znaczenie doboru odpowiednich narzędzi analitycznych w ocenie jego dynamiki.
Wnioski
Opracowany syntetyczny indeks stanowi innowacyjne narzędzie analityczne umożliwiające precyzyjną identyfikację obszarów wymagających interwencji w zakresie poprawy efektywności energetycznej. Kluczowym wkładem badania w rozwój statystyki jest autorskie połączenie metod taksonomicznych z analizą PCA, co pozwoliło zwiększyć obiektywizm i stabilność miar złożonych. Uzyskane wyniki wskazują, że sytuacja poszczególnych województw różni się na tyle istotnie, iż konieczne jest ich indywidualne rozpatrywanie, zamiast opierania się wyłącznie na uśrednionych trendach ogólnokrajowych. Podkreśla to znaczenie podejścia regionalnego w diagnozowaniu i monitorowaniu zjawiska ubóstwa energetycznego.
Słowa kluczowe:
ubóstwo energetyczne, taksonomia, analiza głównych składowych (PCA), wskaźnik syntetyczny.
Pobierz prezentację (docx, 21 kB)Objective
The main objective of the research is to develop a methodology for a multidimensional analysis of energy poverty based on energy indicators and supplemented with non-energy data. The research problem focuses on creating an integrated set of indicators combining technical, economic, and social aspects, enabling a more precise diagnosis of the phenomenon than traditional single measures. The analysis covers the period 2018–2024.
Methods
The study uses data from the Household Budget Survey (HBS), conducted by Statistics Poland on a sample of approximately 32,000 households (2024 data). This source provides a representative database of information on expenditures, income, and living conditions, ensuring high reliability of the analysis. The study covers the entire surveyed population, which allows for drawing nationwide conclusions and identifying social and spatial disparities. Based on the source data, a set of energy poverty indicators was developed, reflecting both economic aspects and qualitative dimensions related to energy use and subjective assessment of housing conditions. The next stage involved an overlap analysis of indicators, enabling the identification of households affected by multidimensional energy poverty and the assessment of co-occurrence of different forms of energy deprivation. Subsequently, taxonomic methods were applied, including the Hellwig method, Weber method, and TOPSIS, as well as Principal Component Analysis (PCA). Non-energy data were incorporated into both approaches, enabling more precise classification of households, dimensionality reduction, and identification of the most relevant factors differentiating levels of energy poverty.
Results
The study showed that a change in the level of detail of questions in the HBS in 2020, affecting the LEAKS indicator, contributed to a noticeable decline in its national value. At the same time, observations from 2024 indicated an increase in selected non-financial indicators in regions affected by flooding, suggesting the sensitivity of these measures to sudden crisis events. The application of indicator overlap analysis enabled the visualization of the intensity of energy poverty. Taxonomic methods captured the direction and scale of changes in household conditions, while PCA enabled the identification of key factors influencing energy poverty levels. The results highlight the complexity of the phenomenon and importance of selecting appropriate analytical tools to assess its dynamics.
Conclusions
The developed synthetic index constitutes an innovative analytical tool enabling precise identification of areas requiring intervention in energy efficiency improvement. A key contribution to statistical methodology is the original combination of taxonomic methods with PCA, which enhanced the objectivity and stability of composite measures. The results indicate substantial regional disparities between voivodeships, which makes it necessary to analyse them individually rather than relying solely on national averages. This underscores the importance of a regional approach in diagnosing and monitoring energy poverty.
Keywords
energy poverty, taxonomy, principal component analysis (PCA), synthetic indicator
Cel
W literaturze ekonomicznej ubóstwo jest powszechnie postrzegane jako zjawisko wielowymiarowe. Jednym z tych wymiarów – oprócz wymiaru dochodowego – jest sytuacja mieszkaniowa ludności. Celem prezentacji jest zbadanie w perspektywie porównawczej związku między ubóstwem dochodowym a ubóstwem mieszkaniowym w krajach europejskich, ze szczególnym uwzględnieniem ich współwystępowania oraz stopnia nakładania się tych wymiarów.
Metody
Dane wykorzystane w analizie pochodzą z Europejskiego Badaniaw Warunków Życia Ludności (EU-SILC) z 2020 r., przeprowadzonego w 30 krajach europejskich. EU-SILC dostarcza zharmonizowanych i porównywalnych mikrodanych, co czyni je wiarygodnym źródłem analizy nierówności społecznych i warunków życia, w tym dochodów, deprywacji materialnej i warunków mieszkaniowych. Rozmiary wykorzystanych zbiorów danych zależą od kraju i wynoszą np. 4192 obserwacji dla Cypru i 19841 dla Polski. Badanie EU-SILC jest zasadniczo badaniem reprezentatywnym, ale w analizach wykorzystano wagi zawarte w zbiorze danych, aby skorygować odchylenia od reprezentatywności próby badawczej. Aby zidentyfikować ubóstwo mieszkaniowe, zastosowano metodę IFR (Integrated Fuzzy and Relative) w wielowymiarowym podejściu niepieniężnym, uwzględniającym wymiar techniczny, finansowy i środowiskowy. Gospodarstwa domowe ubogie monetarnie zidentyfikowano, stosując granicę ubóstwa zdefiniowaną jako 60% mediany ekwiwalentnego dochodu rozporządzalnego, obliczoną oddzielnie dla każdego kraju. Następnie zbadano zależności między ryzykiem wystąpienia różnych rodzajów ubóstwa, stosując kilka miar zależności, w tym współczynnik korelacji liniowej Pearsona, współczynnik korelacji rang Spearmana, korelację odległościową, informację wzajemną i znormalizowaną informację wzajemną. Różnice w ubóstwie mieszkaniowym między gospodarstwami domowymi ubogimi finansowo i nieubogimi zweryfikowano za pomocą testu istotności dla dwóch średnich.
Wyniki
Wyniki wskazują na znaczną heterogeniczność między krajami, zarówno pod względem poziomu, jak i struktury deprywacji. Związek między ubóstwem monetarnym a mieszkaniowym jest specyficzny dla poszczególnych wymiarów. W wymiarze technicznym obserwuje się stosunkowo silną i przeważnie liniową korelację, natomiast w wymiarze finansowym zależność jest słabsza i mniej spójna. Natomiast wymiar środowiskowy nie wykazuje wyraźnego związku z ubóstwem monetarnym. Miary korelacji wskazują w niektórych krajach wręcz na odwrotny schemat, gdzie gospodarstwa domowe o wyższych dochodach doświadczają większego środowiskowej ubóstwa mieszkaniowego. Ważnym wynikiem jest niepełne pokrycie się ubóstwa monetarnego i mieszkaniowego - wiele gospodarstw domowych doświadcza tylko jednej formy ubóstwa.
Wnioski
Wyniki analizy potwierdzają, że jakość mieszkań jest w ograniczonym stopniu determinowana przez dochody gospodarstw domowych, a w dużej mierze przez czynniki przestrzenne, infrastrukturalne i polityczne. Wskazuje to na potrzebę spojrzenia wykraczającego poza podejścia oparte na dochodach i priorytetowo traktującego interwencje lokalne, poprawiające jakość środowiska i warunków sąsiedzkich, niezależnie redystrybucji dochodów. Większa świadomość zagrożeń związanych z nieodpowiednimi warunkami mieszkaniowymi może stymulować popyt na wysokiej jakości, prozdrowotne mieszkania, a w konsekwencji wzmacniać poparcie społeczne dla rozwoju i wdrażania polityk poprawiających warunki mieszkaniowe.
Słowa kluczowe:
ubóstwo dochodowe, ubóstwo mieszkaniowe, wielowymiarowy pomiar ubóstwa, metoda zbiorów rozmytych (IFR), dane EU-SILC
Pobierz prezentację (docx, 24 kB)Objective
Within the economic literature, poverty is commonly conceptualized as a multidimensional phenomenon. One of these dimensions - in addition to the income dimension - is the housing situation of the population. The presentation aims to examine the relationship between income poverty and housing poverty across European countries, with particular emphasis on their co-occurrence and the extent of overlap between these dimensions in a comparative perspective.
Methods
The data used in the analysis come from the European Union – Statistics on Income and Living Conditions (EU-SILC) survey from 2020 for 30 European countries. EU-SILC provides harmonized and comparable microdata across European countries, making it a reliable source for analyzing social inequalities and living conditions. Its multidimensional approach, covering income, material deprivation, and housing conditions. The sizes of the datasets used is depend on the country and is e.g. 4192 for Cyprus and 19841 for Poland. The EU-SILC survey is essentially a representative survey, but the analyses used weights contained in the data set to correct deviations from the representativeness of the research sample.To identify housing poverty, the IFR (Integrated Fuzzy and Relative) method was used in a multidimensional non-monetary approach, taking into account technical, financial, and environmental dimensions. Monetarily poor households were identified using a poverty line defined as 60% of the median equivalized disposable income, calculated separately for each country. Next, the relationships between the risks of different types of poverty were examined using several measures of dependence, including Pearson`s linear correlation coefficient, Spearman`s rank correlation coefficient, distance correlation, mutual information, and normalized mutual information. Differences in housing poverty between monetary-poor and non-poor households were verified by a two-mean significance test.
Results
The results reveal substantial cross-country heterogeneity in both the level and structure of deprivation. The relationship between monetary and housing poverty is dimension-specific. A relatively strong and predominantly linear association is observed in the technical dimension, while the relationship in the financial dimension is weaker and less consistent. In contrast, the environmental dimension shows no clear relationship with monetary poverty. Correlation measures indicate near-zero dependence, and in some countries even suggest a reversed pattern, where higher-income households may experience greater environmental housing deprivation. An important result is the incomplete overlap between monetary and housing poverty – many households experience only one form of poverty.
Conclusions
The findings confirm that housing quality is only to a limited extent determined by household income and is instead strongly shaped by spatial, infrastructural, and policy-related factors. This points to the need for policy frameworks that move beyond income-based approaches and prioritize place-based interventions aimed at improving environmental quality and neighborhood conditions independently of redistribution mechanisms. Greater awareness of the risks associated with inadequate housing conditions can stimulate demand for high-quality, health-promoting housing and, consequently, strengthen public support for the development and implementation of policies that improve housing conditions.
Keywords
monetary poverty, housing poverty, multidimensional poverty measurement, fuzzy set approach (IFR), EU-SILC data
Cel
Celem badania jest porównawcza ocena kosztów fiskalnych i efektów redystrybucyjnych stylizowanej gwarancji zatrudnienia (Job Guarantee) w 27 państwach członkowskich Unii Europejskiej. Główne pytanie badawcze dotyczy tego, w jakim stopniu koszt netto i siła redystrybucyjna takiej polityki zależą od struktury istniejącego systemu podatkowo-świadczeniowego oraz reżimu welfare state. Postawiono hipotezę o strukturalnym napięciu: kraje, w których gwarancja zatrudnienia jest fiskalnie najmniej kosztowna, są jednocześnie krajami, w których jej efekt redystrybucyjny jest najsłabszy.
Metody
Wykorzystano unijny model mikrosymulacji systemów podatkowo-świadczeniowych EUROMOD w wersji J2.0+, zarządzany przez Wspólne Centrum Badawcze (JRC) Komisji Europejskiej. Źródłem danych są zharmonizowane zbiory wejściowe modelu oparte na europejskim badaniu warunków życia ludności (EU-SILC) prowadzonym przez Eurostat na reprezentatywnych próbach losowych gospodarstw domowych. Liczebność próby waha się od kilku tysięcy gospodarstw w mniejszych państwach do ok. 25-30 tys. w największych - łącznie ponad 250 tys. gospodarstw i ok. 600 tys. osób. Uogólnienie na populację dokonywane jest za pomocą zharmonizowanych wag kalibracyjnych (grossing-up factors) zgodnie z konwencją Eurostatu. Gwarancję zatrudnienia operacjonalizowano jako ofertę pełnoetatowej pracy publicznej dla osób długotrwale bezrobotnych przy wynagrodzeniu równym 60% krajowej mediany zarobków. Dla każdego państwa wykonano symulację stanu odniesienia i wariantu reformy, a następnie obliczono dekompozycję kosztu fiskalnego (koszt brutto, oszczędności w świadczeniach, wpływy podatkowo-składkowe, koszt netto) oraz wskaźniki redystrybucyjne (Gini, stopa ubóstwa przy progu 60% mediany ekwiwalentnego dochodu, zmiany dochodu w decylach). Ocenę jakości oparto na analizie wrażliwości na poziom płacy (80%, 100%, 120%) i testach istotności korelacji przekrojowych. Wyniki traktowane są jako projekcje warunkowe oparte na statycznej mikrosymulacji bez reakcji behawioralnych.
Wyniki
Wstępne wyniki wskazują na bardzo silne zróżnicowanie efektów gwarancji zatrudnienia w UE. Szacowane koszty netto rozkładają się w szerokim zakresie - od kilku setnych do kilku procent PKB - przy medianie znacznie poniżej 1% PKB. Współczynnik samofinansowania, wyrażający udział kosztu brutto pokrywany przez mniejsze wydatki na świadczenia oraz dodatkowe wpływy podatkowo-składkowe, silnie różni się między krajami i jest dodatnio skorelowany z hojnością istniejącego systemu zabezpieczenia społecznego. Efekty redystrybucyjne - redukcja ubóstwa, zmiana Giniego, przyrost dochodu w najniższych decylach - są największe w krajach o słabszym systemie świadczeń, a najmniejsze w państwach o rozbudowanym welfare state
Wnioski
Wyniki ujawniają strukturalne napięcie redystrybucyjno-kosztowe: ta sama charakterystyka instytucjonalna, która sprawia, że gwarancja zatrudnienia jest fiskalnie atrakcyjna, ogranicza jej zasięg redystrybucyjny. Wynika z tego, że ekonomiczna ocena tej polityki musi mieć charakter warunkowy - uniwersalne sądy o „opłacalności” są mylące i powinny być zastępowane analizą uwzględniającą kontekst krajowego systemu podatkowo-świadczeniowego. Badanie dostarcza pierwszej spójnej, porównawczej oceny gwarancji zatrudnienia w UE oraz dekompozycji jej kosztu według dwóch kanałów absorpcji: oszczędności na świadczeniach i dodatkowych wpływów podatkowo-składkowych.
Słowa kluczowe:
gwarancja zatrudnienia, mikrosymulacja, EUROMOD, welfare state, redystrybucja
Pobierz prezentację (docx, 20 kB)Objective
This study provides a comparative assessment of the fiscal costs and distributional effects of a stylised Job Guarantee (JG) across all 27 EU member states. The central research question is the extent to which the policy`s net cost and redistributive impact depend on the structure of the existing tax-benefit system and the welfare-state regime in place. The working hypothesis is that a structural tension exists: countries where a JG is fiscally cheapest are precisely those where its redistributive reach is weakest.
Methods
The analysis uses EUROMOD version J2.0+, the EU-wide tax-benefit microsimulation model maintained by the Joint Research Centre (JRC) of the European Commission. The micro-level data are EUROMOD`s harmonised input files derived from EU-SILC, conducted by Eurostat with national statistical offices on representative random samples of households. National sample sizes range from a few thousand households in smaller member states to roughly 25–30 thousand in the largest, totalling more than 250 thousand households and about 600 thousand individuals. Population estimates use harmonised grossing-up factors aligned with Eurostat conventions. The Job Guarantee is operationalised as a full-time public employment offer for the long-term unemployed, paid at 60 percent of the country-specific median wage. For each country a baseline and a reform scenario are simulated: the fiscal cost is decomposed into gross cost, benefit savings, additional tax and social-contribution revenue, and net cost. Redistributive effects are measured by the Gini coefficient, the at-risk-of-poverty rate at 60 percent of median equivalised disposable income, and decile income changes. Quality assessment relies on sensitivity analysis of the JG wage (80, 100, 120 percent of the benchmark) and on significance tests of cross-country correlations. Results are interpreted as conditional projections from a static microsimulation without behavioural responses.
Results
Preliminary results show pronounced cross-country heterogeneity in the effects of a Job Guarantee within the EU. Estimated net costs span a wide range - from a small fraction to several percent of GDP - with a median well below 1 percent of GDP. The self-financing ratio, defined as the share of the gross cost recouped through reduced benefit spending and additional tax and social-contribution revenue, also varies substantially across countries and is positively correlated with the generosity of the existing social protection system. Redistributive effects - poverty reduction, the change in the Gini coefficient, and income gains in the lowest deciles - are largest in countries with weaker benefit systems and smallest in countries with extensive welfare states.
Conclusions
The findings reveal a structural redistribution-cost tension: the same institutional features that make a Job Guarantee fiscally attractive also limit its redistributive reach. Economic assessment of the policy must therefore be conditional - universal claims about its `affordability` are misleading and should give way to analysis that takes the national tax-benefit context seriously. The study delivers the first coherent comparative assessment of a Job Guarantee in the EU together with a fiscal-cost decomposition along two absorption channels: benefit savings and additional tax and social-contribution revenue.
Keywords
Job Guarantee, microsimulation, EUROMOD, welfare state, redistribution
Cel
Celem badania była identyfikacja i porównanie profili funkcjonowania osób starszych w krajach Grupy Wyszehradzkiej w kontekście zdrowia, warunków materialnych i bezpieczeństwa ekonomicznego. Postawiono pytanie, czy sytuacja seniorów ma charakter jednorodny, czy też tworzy zróżnicowane układy cech oraz w jakim stopniu profile te są podobne między krajami. Znajomość profili funkcjonowania osób starszych ma istotne znaczenie w analizach porównawczych.
Metody
W analizie wykorzystano dane EU-SILC za 2024 rok dotyczące osób w wieku 65+, obejmujące ponad 27 tys. obserwacji dla krajów Polski, Czech, Węgier i Słowacji. Dane pochodzą z reprezentacyjnego badania statystyki publicznej realizowanego na próbie losowej, przy czym zastosowanie wag przekrojowych umożliwiło uogólnienie uzyskanych wyników na populację osób starszych w analizowanych krajach. W pierwszym etapie przeprowadzono analizę czynnikową opartą na macierzy korelacji tetrachoricznych w celu identyfikacji ukrytej struktury między zmiennymi opisującymi zdrowie, warunki materialne oraz bezpieczeństwo ekonomiczne. Następnie, z wykorzystaniem metody TwoStep Cluster, wyodrębniono profile funkcjonowania osób starszych. W dalszej części zastosowano analizę podobieństwa struktur wraz z testami istotności różnic strukturalnych, a także procedurę identyfikacji wyróżniających się różnic pomiędzy uzyskanymi profilami funkcjonowania. Uzupełnieniem analizy było oszacowanie wielomianowego modelu logitowego, pozwalającego na ocenę determinant przynależności do poszczególnych profili, z uwzględnieniem zmiennych demograficznych i przestrzennych. Wszystkie analizy zostały przeprowadzone z wykorzystaniem pakietów statystycznych SPSS oraz Statistica.
Wyniki
Wyodrębniono cztery profile funkcjonowania osób starszych, z których największy ma charakter pośredni, lokujący się między skrajnymi konfiguracjami deficytów i zasobów. Wyniki jednoznacznie wskazują, że zdrowie, warunki materialne i bezpieczeństwo ekonomiczne nie tworzą jednego spójnego wymiaru, lecz układ współzależnych, ale częściowo autonomicznych komponentów. Struktura tych profili jest zasadniczo zbieżna między krajami, jednak różni się ich udział oraz natężenie poszczególnych cech, przy czym największe zróżnicowanie dotyczy ograniczeń zdrowotnych i funkcjonalnych. Jednocześnie obserwowane profile wskazują na istnienie konfiguracji mieszanych, w których korzystna sytuacja w jednym obszarze współwystępuje z deficytami w innych wymiarach funkcjonowania.
Wnioski
Uzyskane rezultaty potwierdzają, że sytuacja osób starszych ma charakter złożony i niejednorodny, a obserwowane profile funkcjonowania, choć wspólne dla krajów V4, przyjmują odmienną wagę w zależności od kontekstu krajowego. Wskazuje to na ograniczoną użyteczność analiz opartych wyłącznie na zagregowanych wskaźnikach oraz podkreśla znaczenie podejścia strukturalnego. Uzyskane wyniki sugerują konieczność projektowania polityki społecznej w sposób zróżnicowany, uwzględniający zarówno międzykrajowe różnice w strukturze populacji seniorów, jak i ich wewnętrzną heterogeniczność. Skuteczne interwencje wymagają jednoczesnego odniesienia do zdrowia oraz bezpieczeństwa ekonomicznego.
Słowa kluczowe:
osoby starsze, EU-SILC, bezpieczeństwo ekonomiczne, profilowanie, identyfikacja istotnych różnic
Pobierz prezentację (pdf, 133 kB)Objective
The aim of the study was to identify and compare the profiles of older adults across the Visegrad Group countries regarding health, material conditions, and economic security. The study sought to determine whether the situation of older adults is homogeneous or whether it exhibits diverse patterns of characteristics, and to what extent these profiles are similar across countries. Understanding the profiles of older adults enables us to assess whether similar indicator values across countries reflect genuine similarities in their situation.
Methods
The analysis utilised EU-SILC data (European Union Statistics on Income and Living Conditions) for 2024 on individuals aged 65 and older, comprising over 27,000 observations for Poland, the Czech Republic, Hungary, and Slovakia. The data come from a representative public statistics survey conducted on a random sample, and the use of cross-sectional weights allowed the results to be generalised to the elderly population in the analysed countries. In the first stage, a factor analysis based on a tetrachoric correlation matrix was conducted to identify the latent structure among variables describing health, material conditions, and economic security. Subsequently, using the Two-Step Cluster method, profiles of older adults’ functioning were identified. In the subsequent stage, a structural similarity analysis was applied, along with tests of the significance of structural differences and a procedure to identify distinctive differences between the obtained functioning profiles. The analysis was supplemented by an estimation of a multinomial logit model, allowing for the assessment of determinants of membership in specific profiles, taking into account demographic and spatial variables. All analyses were conducted using SPSS and Statistica.
Results
Four profiles of older adults’ functioning have been identified, the largest of which is intermediate, situated between the extreme configurations of deficits and resources. The results clearly indicate that health, material conditions, and economic security do not form a single coherent dimension, but rather a system of interdependent yet partially autonomous components. The structure of these profiles is generally consistent across countries, though the proportions and intensities of individual characteristics vary, with the greatest variation in health and functional limitations. At the same time, the observed profiles indicate the existence of mixed configurations, in which a favourable situation in one area coexists with deficits in other dimensions of functioning.
Conclusions
The results confirm that the situation of older adults is complex and heterogeneous, and that the observed functional profiles, while common across the V4 countries, take on different significance in different national contexts. This points to the limited usefulness of analyses based solely on aggregated indicators and underscores the importance of a structural approach. The results suggest the need to design social policy in a differentiated manner, taking into account both cross-national differences in the structure of the elderly population and the internal heterogeneity of the elderly population. Effective interventions require simultaneous consideration of multiple aspects of living.
Keywords
older adults, EU-SILC, economic security, profiling, identification of significant differences
Cel
Artykuł analizuje integrację ekonomiczną imigrantów z Ukrainy w Polsce, porównując przedwojennych migrantów zarobkowych z uchodźcami, którzy przybyli po rosyjskiej inwazji w 2022 r. Badanie sprawdza, czy wyniki na rynku pracy poprawiają się wraz z długością pobytu oraz czy integracja uchodźców przebiega inaczej niż w przypadku wcześniejszych kohort migracyjnych. Oceniono także wybrane wymiary integracji społecznej, w tym znajomość języka i samodzielność mieszkaniową.
Metody
W badaniu wykorzystano powtarzane dane przekrojowe z pięciu ogólnopolskich fal badań ankietowych migrantów z Ukrainy prowadzonych przez Narodowy Bank Polski w 2019 r. oraz corocznie w latach 2022–2025. Każda fala obejmowała około 3–4 tys. respondentów i zawierała szczegółowe informacje dotyczące sytuacji na rynku pracy, dochodów, historii migracyjnej, statusu pobytowego, znajomości języka polskiego oraz warunków mieszkaniowych. Ramy analityczne nawiązują do międzynarodowej literatury dotyczącej integracji ekonomicznej migrantów, koncentrującej się na procesie stopniowego zbliżania wyników migrantów do sytuacji ludności kraju przyjmującego. Zastosowano dwie komplementarne miary długości pobytu: liczbę lat od pierwszego nieturystycznego pobytu w Polsce oraz liczbę lat od rozpoczęcia obecnego pobytu. Pozwala to uchwycić zarówno skumulowane doświadczenie migracyjne, jak i stabilność zamieszkania. Analizowane zmienne obejmują stopę zatrudnienia, przeciętne wynagrodzenia netto (szacowane na podstawie kategorii dochodowych), rodzaj umowy, samozatrudnienie, samoocenę znajomości języka polskiego oraz niezależność mieszkaniową. Porównano migrantów przybyłych przed 2022 r. z kohortami uchodźców po 2022 r., w tym osób objętych statusem PESEL-UKR. Oprócz analiz przekrojowych zastosowano analizę kohort migracyjnych, grupując respondentów według roku przyjazdu i śledząc ich wyniki w kolejnych falach badania.
Wyniki
Wyniki wskazują na wyraźne różnice między uchodźcami a wcześniejszymi migrantami. Migranci przed 2022 rokiem osiągali bardzo wysokie wskaźniki zatrudnienia, często wyższe niż polscy obywatele, natomiast uchodźcy zaczynali od znacznie niższego poziomu, lecz integrowali się relatywnie szybko. W ciągu trzech lat zatrudnienie uchodźców przekroczyło 60%, szybciej niż w wielu krajach Europy. Utrzymuje się luka płacowa: wcześniejsi migranci zarabiali średnio o około 1000 zł więcej niż osoby przybyłe po 2022 r. Dłuższy pobyt sprzyjał także wzrostowi udziału umów stałych, samozatrudnienia, lepszej znajomości języka polskiego oraz samodzielności mieszkaniowej.
Wnioski
Przepisy o ochronie czasowej imigrantów wprowadzone w Polsce w 2022 roku umożliwiły niezwykle szybki dostęp ukraińskich uchodźców na rynek pracy. Jednak konwergencja płac i jakości pracy przebiega wolniej niż konwergencja zatrudnienia. Czas spędzony w Polsce pozostaje kluczowym czynnikiem integracji, nie tylko ekonomicznej, ale także społecznej, poprzez naukę języka i niezależność mieszkaniową. Badanie wnosi wkład w badania migracyjne, łącząc podejścia kohortowe i przekrojowe oraz dostarczając obserwacji istotnych dla kształtowania polityki rynku pracy, mieszkaniowej i integracyjnej.
Słowa kluczowe:
migranci z Ukrainy, uchodźcy, integracja na rynku pracy, Polska, kohorty migracyjne
Pobierz prezentację (docx, 20 kB)Objective
The paper analyses the economic integration of Ukrainian immigrants in Poland, comparing pre-war labour migrants with refugees who arrived after the Russian invasion in 2022. It examines whether labour market outcomes improve with duration of stay and whether refugee integration follows different trajectories than earlier migration cohorts. The study also assesses selected dimensions of broader social integration, including language skills and housing independence
Methods
The study uses repeated cross-sectional data from five nationwide waves of surveys of Ukrainian immigrants conducted by the National Bank of Poland in 2019 and annually from 2022 to 2025. Each wave covered approximately 3,000–4,000 respondents and provides detailed information on labour market status, earnings, migration history, legal status, language proficiency and housing conditions. The analytical framework follows the international literature on immigrant labour market integration, focusing on convergence over time. Two complementary measures of migration duration are applied: years since the first non-touristic stay in Poland and years since the beginning of the current stay. These indicators allow identification of both accumulated migration experience and stability of residence. Key dependent variables include employment rates, average net wages (estimated from income categories), contract type, self-employment, self-assessed command of Polish, and housing independence. The study compares pre-2022 immigrants with post-2022 refugee cohorts, including persons under PESEL-UKR temporary protection. In addition to cross-sectional comparisons, synthetic cohort analysis is used by grouping respondents according to year of arrival and tracing cohort outcomes across subsequent survey waves.
Results
The results show clear differences between refugees and earlier immigrants. Pre-war migrants reached very high employment rates, often above those of the native population, while refugees started from much lower levels but integrated relatively quickly. Within three years, refugee employment exceeded 60%, faster than in many European countries. Wage gaps remained substantial: earlier migrants earned about PLN 1,000 more on average than post-2022 arrivals. Longer stay was also associated with a higher share of permanent contracts and some growth in self-employment. Language proficiency and independent housing improved strongly with time spent in Poland.
Conclusions
Poland’s temporary protection regulations implemented in Poland enabled unusually rapid labour market entry of Ukrainian refugees. However, convergence in wages and job quality is slower than convergence in employment. Time spent in Poland remains a key driver of integration, not only economically but also socially through language acquisition and housing independence. The study contributes to migration research by combining cohort and cross-sectional approaches and offers evidence relevant for labour market, housing and integration policy design.
Keywords
Ukrainian migrants, refugees, labour market integration, Poland, migration cohorts
Cel
Główne pytanie badawcze postawione w artykule dotyczy tego, czy i w jaki sposób zmieniały się stopy zwrotu z edukacji oraz doświadczenia zawodowego w Polsce w ostatnich dwudziestu latach, a także czy zmiany te różnią się w zależności od płci, poziomu wykształcenia i długości stażu pracy. Autorzy dążą do ustalenia, czy tradycyjne czynniki kapitału ludzkiego nadal odgrywają kluczową rolę w kształtowaniu wynagrodzeń, czy też ich znaczenie ulega osłabieniu w warunkach zmian strukturalnych i technologicznych gospodarki.
Metody
W niniejszym badaniu zastosowano ilościowy, podłużny model badawczy w celu oszacowania zwrotów z inwestycji w wykształcenie i doświadczenie zawodowe w Polsce w latach 2004–2024. Ramy empiryczne opierają się na rozszerzonej funkcji zarobków Mincera, w której logarytm wynagrodzenia wyjaśniany jest przez poziom wykształcenia, doświadczenie zawodowe (ujęte w sposób nieliniowy) oraz efekty czasowe. Model oszacowano na połączonych danych przekrojowych z zmiennymi czasowymi, co umożliwiło analizę zarówno średnich wspomnianych zwrotów, jak i ich zmian w czasie. Głównym narzędziem analitycznym jest ekonometryczna analiza regresji, pozwalająca oszacować efekty marginalne wykształcenia i doświadczenia. Dodatkowe specyfikacje obejmują modele uwzględniające płeć oraz warianty uwzględniające heterogeniczność poziomów wykształcenia i doświadczenia. Testy odporności obejmują badanie stabilności modelu oraz uwzględnienie zmiennych makroekonomicznych, takich jak stopa bezrobocia. W analizie wykorzystano dane wtórne pochodzące z badania struktury wynagrodzeń przeprowadzonego przez Główny Urząd Statystyczny (GUS). Zbiór danych jest zagregowany na poziomie trzycyfrowym według zawodów i obejmuje dane pochopdzące z przedsiębiorstw zatrudniających co najmniej dziesięciu pracowników, co zapewnia wysoką wiarygodność danych dotyczących wynagrodzeń. Próba obejmuje 13 914 obserwacji z 11 fal badania. Wykształcenie przypisuje się do zawodów w oparciu o klasyfikację ISCO, dostosowaną do polskiego kontekstu
Wyniki
Uzyskane wyniki wskazują na spadek stóp zwrotu z edukacji, jak i z doświadczenia zawodowego. Średnia stopa zwrotu z edukacji obniżyła się z 17,2% w 2004 r. do 15,5% w 2024 r., przy czym spadek ten był szczególnie wyraźny wśród kobiet. Co istotne, w 2018 r. nastąpiło odwrócenie relacji płciowych. Od 2018 r. kobiety zaczęły osiągać niższe zwroty z edukacji niż mężczyźni. Podobny trend spadkowy dotyczy doświadczenia zawodowego, którego premia zmniejszyła się z 16,1% do 11,2%, a w przypadku kobiet spadek był jeszcze silniejszy. Analiza według poziomów wykształcenia pokazuje, że choć najwyższe premie za wykształcenie dotyczą wykształcenia wyższego, to obserwowany jest ich spadek. Jednocześnie relatywnie wyższe pozostają zwroty z edukacji zawodowej w porównaniu z ogólną na poziomie średnim.
Wnioski
Wnioski płynące z badania wskazują na istotną transformację mechanizmów kształtujących wynagrodzenia. Malejące znaczenie edukacji i doświadczenia sugeruje, że tradycyjne miary kapitału ludzkiego tracą na znaczeniu. Wyniki wspierają hipotezę, że ekspansja edukacji wyższej prowadzi do kompresji rozkładu wynagrodzeń. Z perspektywy polityki gospodarczej oznacza to potrzebę większego zrównoważenia systemu edukacji, w szczególności rozwoju uczenia się przez całe życie oraz promowania szkolnictwa technicznego. Jednocześnie obserwowane zmiany w różnicach płciowych wskazują, że równość dostępu do edukacji nie przekłada się na równość efektów na rynku pracy.
Słowa kluczowe:
równanie Mincera, zwrot z edukacji, doświadczenie zawodowe, różnice płciowe
Pobierz prezentację (docx, 20 kB)Objective
The main research question addressed in this article concerns whether and how the returns to education and work experience in Poland have changed over the last twenty years, and whether these changes vary according to gender, educational attainment and work seniority. The authors aim to determine whether traditional human capital factors continue to play a key role in shaping wages, or whether their significance is diminishing in the context of structural and technological changes in the economy.
Methods
This study applies a quantitative, longitudinal research design to estimate returns to education and work experience in Poland over 2004–2024. The empirical framework is based on an extended Mincer earnings function, where the logarithm of wages is explained by education level, work experience, its quadratic term, and time effects. The model is estimated on pooled cross-sectional data with time dummies, enabling the analysis of both average returns and their changes over time. Econometric regression analysis constitutes the main analytical tool, allowing estimation of marginal effects of education and experience. Additional specifications include gender-specific models and variants capturing heterogeneity across education and experience levels. Robustness checks involve testing model stability and including macroeconomic controls such as the unemployment rate. The analysis uses secondary data from the Structure of Earnings Survey conducted by Statistics Poland (GUS). The dataset is aggregated at the three-digit occupational level and covers firms employing at least ten workers, ensuring high reliability of wage data. The sample includes 13,914 observations across 11 waves. Education is assigned to occupations based on ISCO classification, adjusted to the Polish context, while experience is measured in intervals.
Results
The results indicate a decline in the rates of return on both education and work experience. The average rate of return on education fell from 17.2% in 2004 to 15.5% in 2024, with this decline being particularly pronounced among women. Significantly, a reversal in gender relations occurred in 2018. From 2018 onwards, women began to achieve lower returns on education than men. A similar downward trend applies to work experience, where the premium fell from 16.1% to 11.2%, and the decline was even more pronounced for women. An analysis by level of education shows that although the highest education premiums relate to higher education, a decline is being observed. At the same time, returns on vocational education remain relatively higher compared to general education at secondary level.
Conclusions
The findings of the study point to a significant transformation in the mechanisms shaping wages. The declining importance of education and experience suggests that traditional measures of human capital are losing their significance. The results support the hypothesis that the expansion of higher education leads to a compression of the wage distribution. From an economic policy perspective, this implies a need for greater balance in the education system, in particular the development of lifelong learning and the promotion of technical education. At the same time, the observed changes in gender differences indicate that equal access to education does not translate into equal outcomes in the la
Keywords
Mincer equation, returns to education, work experience, gender differences
-
Cel
Artykuł koncentruje się na zagadnieniu kształtowania krajowego miksu energetycznego z rosnącym udziałem energii słonecznej i wiatrowej, w kontekście zapewnienia stabilności i bezpieczeństwa systemu energetycznego. Celem artykułu jest opracowanie modeli ekonometrycznych umożliwiających prognozowanie produkcji energii elektrycznej ze źródeł odnawialnych w Polsce oraz identyfikacja sezonowych wahań podaży energii odnawialnej, w tym okresów jej nadwyżek i deficytów. Na tej podstawie podjęto próbę wskazania możliwych kierunków optymalizacji zarządzania krajowym miksem energetycznym.
Metody
Badanie oparto na danych wtórnych pochodzących z publicznych baz danych, w szczególności danych miesięcznych dotyczących produkcji energii elektrycznej z odnawialnych źródeł energii w Polsce. W badaniu zastosowano modele ekonometryczne uwzględniające trendu deterministyczny oraz sezonowości dla obydwu analizowanych źródeł energii. Dla energii słonecznej ustalono model sezonowości multiplikatywnej, natomiast dla energii wiatrowej zastosowano model sezonowości addytywnej. Parametry modeli estymowano metodą najmniejszych kwadratów, a ich jakość oceniono na podstawie miar dopasowania oraz analizy reszt. Dodatkowo przeprowadzono weryfikację istotności statystycznej parametrów oraz analizę stabilności modeli w czasie. Na podstawie ustalonych wahań miesięcznych dokonano identyfikacji okresów nadprodukcji oraz niedoboru energii i wyznaczono średnie wartości produkcji w tych okresach. Prognozy wyznaczono dla horyzontu rocznego, co pozwoliło na identyfikację aktualnych trendów oraz potencjalnych okresów nadwyżek i deficytów energii. Przyjęto dwa scenariusze prognoz oparte na założeniu kontynuacji ustalonego na podstawie estymacji parametrów modelu trendu oraz na założeniu występowania trendu horyzontalnego.
Wyniki
Uzyskane wyniki wskazują na wyraźną sezonowość produkcji energii odnawialnej w Polsce, przy czym energia słoneczna osiąga maksimum w miesiącach letnich, natomiast energia wiatrowa charakteryzuje się większą produkcją w okresie jesienno-zimowym. Zidentyfikowano istotne wahania miesięczne, które prowadzą do okresowych nadwyżek energii w sezonie letnim oraz deficytów w okresach przejściowych. Modele wykazały rosnący trend produkcji OZE, co potwierdza dynamiczny rozwój tego sektora. W badaniu zastosowano modele ekonometryczne uwzględniające komponent trendu oraz sezonowości dla obu analizowanych źródeł energii. W oparciu o przeprowadzoną analizę sformułowano propozycje strategii zarządzanie krajowym miksem energetycznym, ze szczególnym uwzględnieniem warunków Polski.
Wnioski
Przeprowadzona analiza wskazuje na konieczność dostosowania struktury miksu energetycznego do rosnącego udziału odnawialnych źródeł energii poprzez rozwój mechanizmów bilansowania, magazynowania energii oraz elastycznych źródeł konwencjonalnych. W artykule podkreślono także rolę zaawansowanych metod analitycznych w procesie podejmowania decyzji strategicznych związanych z krajową polityką energetyczną oraz na potrzebę integracji tej polityki z długofalowymi celami klimatycznymi. Wyniki stanowią wkład w rozwój dyskusji nad kierunkami modernizacji systemu energetycznego w Polsce w warunkach transformacji energetycznej i realizacji celów klimatycznych.
Słowa kluczowe:
transformacja energetyczna, energia słoneczna, energia wiatrowa, bezpieczeństwo energetyczne krajowy miks energetyczny
Pobierz prezentację (docx, 33 kB)Objective
The article focuses on the issue of shaping the national energy mix with a growing share of solar and wind energy, in the context of ensuring the stability and security of the energy system. The aim of the article is to develop econometric models enabling the forecasting of electricity production from renewable energy sources in Poland as well as the identification of seasonal fluctuations in the supply of renewable energy, including periods of its surpluses and deficits. On this basis, an attempt was made to indicate possible directions for optimizing the management of the national energy mix
Methods
The study was based on secondary data originating from public databases, in particular monthly data concerning electricity production from renewable energy sources in Poland. The study applied econometric models taking into account a deterministic trend and seasonality for both analyzed energy sources. For solar energy, a multiplicative seasonality model was established, whereas for wind energy an additive seasonality model was applied. The parameters of the models were estimated using the least squares method, and their quality was assessed on the basis of goodness-of-fit measures and residual analysis. Additionally, verification of the statistical significance of parameters and analysis of model stability over time were conducted. Based on the identified monthly fluctuations, periods of overproduction and energy shortages were identified and average production values in these periods were determined. Forecasts were determined for an annual horizon, which allowed for the identification of current trends and potential periods of energy surpluses and deficits. Two forecast scenarios were adopted based on the assumption of continuation of the trend determined on the basis of parameter estimation of the model and on the assumption of the occurrence of a horizontal trend.
Results
The obtained results indicate a clear seasonality of renewable energy production in Poland, with solar energy reaching its maximum in the summer months, while wind energy is characterized by higher production in the autumn-winter period. Significant monthly fluctuations were identified, which lead to periodic energy surpluses in the summer season and deficits in transitional periods. The models showed a growing trend in RES production, which confirms the dynamic development of this sector. The study applied econometric models taking into account the trend and seasonality components for both analyzed energy sources. Based on the conducted analysis, proposals for strategies for managing the national energy mix were formulated, with particular emphasis on the conditions of Poland.
Conclusions
The conducted analysis indicates the necessity of adapting the structure of the energy mix to the growing share of renewable energy sources through the development of balancing mechanisms, energy storage, and flexible conventional sources. The article also emphasized the role of advanced analytical methods in the process of making strategic decisions related to national energy policy and the need to integrate this policy with long-term climate goals. The results constitute a contribution to the development of the discussion on the directions of modernization of the energy system in Poland under conditions of energy transformation and the implementation of climate goals.
Keywords
energy transformation, solar energy, wind energy, energy security, national energy mix
Cel
Celem badania jest identyfikacja oraz statystyczna ocena determinant i barier współpracy przedsiębiorstw z sektorem nauki w procesach transferu i komercjalizacji innowacji. Problem badawczy dotyczy określenia siły i kierunku zależności między cechami przedsiębiorstw a poziomem ich zaangażowania we współpracę z ośrodkami naukowymi. Badanie zmierza do weryfikacji tezy o istotnym wpływie czynników strukturalnych i organizacyjnych na ograniczenia w transferze wiedzy.
Metody
Badanie przeprowadzono z wykorzystaniem techniki wywiadu telefonicznego wspomaganego komputerowo (CATI). Dane pochodzą z badań własnych realizowanych na próbie przedsiębiorstw z województwa kujawsko-pomorskiego. Próba miała charakter celowy i warstwowy, z uwzględnieniem wielkości przedsiębiorstw (małe, średnie, duże) oraz rodzaju działalności (produkcja, handel, usługi). Łączna liczebność próby wyniosła 433 jednostki, w tym 367 przedsiębiorstw z sektora MŚP oraz 66 przedsiębiorstw dużych. Dobór próby oparto na strukturze populacji przedsiębiorstw zarejestrowanych w bazie REGON, a poziom błędu oszacowania przyjęto odpowiednio na poziomie 5% dla MŚP oraz 10% dla przedsiębiorstw dużych. Analiza danych obejmowała zastosowanie statystyk opisowych (miary struktury, wskaźniki udziału) oraz analizę zależności między zmiennymi jakościowymi z wykorzystaniem testów istotności (?2) i analizy różnic między grupami przedsiębiorstw. W celu oceny jakości wyników uwzględniono strukturę próby oraz możliwość uogólniania wyników na populację regionalną. Interpretacja wyników została oparta na analizie istotności statystycznej oraz relacji między zmiennymi dotyczącymi poziomu innowacyjności, współpracy i barier wdrażania innowacji.
Wyniki
Analiza statystyczna potwierdziła niski poziom współpracy przedsiębiorstw z sektorem nauki – brak współpracy z uczelniami deklaruje 77,1% podmiotów, a z instytutami badawczymi ponad 90% . Wykazano istotne zróżnicowanie poziomu współpracy ze względu na wielkość przedsiębiorstwa, przy czym większe podmioty częściej podejmują współpracę. Zidentyfikowano statystycznie istotne bariery, w tym różnice w celach i priorytetach (66,1%), trudności komunikacyjne (60%) oraz niski poziom elastyczności instytucji naukowych (58,4%). Jednocześnie wysoki poziom kompetencji kadry naukowej oraz dostęp do infrastruktury badawczej wykazują dodatnią zależność z gotowością do współpracy.
Wnioski
Wyniki badania wskazują na strukturalny charakter ograniczeń w transferze wiedzy między nauką a gospodarką, potwierdzony analizą statystyczną. Istotność zidentyfikowanych zależności uzasadnia konieczność projektowania polityk publicznych oraz modeli współpracy uwzględniających zróżnicowanie przedsiębiorstw. Wkład pracy obejmuje zastosowanie podejścia statystycznego do analizy relacji nauka–biznes oraz identyfikację kluczowych czynników determinujących efektywność procesów komercjalizacji innowacji w ujęciu regionalnym.
Słowa kluczowe:
analiza statystyczna: transfer technologii: innowacje: współpraca nauka–biznes: komercjalizacja
Pobierz prezentację (docx, 18 kB)Objective
The aim of the study is to identify and statistically assess the determinants and barriers of collaboration between enterprises and the science sector in the processes of innovation transfer and commercialization. The research problem focuses on determining the strength and direction of relationships between firm characteristics and the level of their engagement in cooperation with scientific institutions. The study seeks to verify the hypothesis that structural and organizational factors have a significant impact on limitations in knowledge transfer.
Methods
The study was conducted using the Computer-Assisted Telephone Interviewing (CATI) technique. The data originate from primary research carried out on a sample of enterprises from the Kuyavian-Pomeranian Voivodeship. The sample was purposive and stratified, taking into account firm size (small, medium, large) and type of activity (manufacturing, trade, services). The total sample size amounted to 433 units, including 367 small and medium-sized enterprises (SMEs) and 66 large enterprises. The sampling design was based on the population structure of enterprises registered in the REGON database, with the estimation error assumed at 5% for SMEs and 10% for large enterprises. The data analysis included descriptive statistics (structure measures and share indicators) as well as the analysis of relationships between qualitative variables using significance tests (?2) and comparisons across enterprise groups. To assess the quality of results, the sample structure and the possibility of generalizing findings to the regional population were taken into account. The interpretation of results was based on statistical significance and the relationships between variables related to the level of innovation, cooperation, and barriers to innovation implementation.
Results
The statistical analysis confirmed a low level of collaboration between enterprises and the science sector—77.1% of entities reported no cooperation with universities, and over 90% with research institutes. Significant variation in the level of cooperation was observed depending on firm size, with larger enterprises more likely to engage in collaboration. Statistically significant barriers were identified, including differences in goals and priorities (66.1%), communication difficulties (60%), and low institutional flexibility of scientific institutions (58.4%). At the same time, a high level of academic staff expertise and access to research infrastructure were positively associated with the willingness to cooperate.
Conclusions
The results indicate the structural nature of constraints in knowledge transfer between science and the economy, as confirmed by statistical analysis. The significance of the identified relationships justifies the need to design public policies and collaboration models that account for the heterogeneity of enterprises. The contribution of the study lies in the application of a statistical approach to the analysis of science–business relations and in identifying key factors determining the effectiveness of innovation commercialization processes at the regional level.
Keywords
statistical analysis: technology transfer: innovation: science–business collaboration: commercialization
Pobierz prezentację (docx, 18 kB)Objective
This study aims to measure and assess the level of satisfaction among beneficiaries of the EU IPARD programme in Denizli Province, Turkey. The research problem concerns the limited analysis of beneficiaries’ subjective evaluations at the sub-provincial level. The study asks how satisfaction can be measured using survey data and whether beneficiary satisfaction varies across districts within the province.
Methods
The empirical analysis in this study combines a survey-based data collection approach with a multi-criteria evaluation method to assess beneficiaries’ satisfaction with the IPARD programme in Denizli Province. Primary data were collected through a structured survey conducted among programme beneficiaries in 2025. The population frame consisted of 723 IPARD-supported projects. The required sample size was calculated using a finite population correction with a 95% confidence level, maximum variability, and a 10% margin of error, yielding approximately 85 beneficiaries. In practice, 90 interviews were conducted, and 86 fully completed questionnaires were retained for analysis. Interviews were allocated across districts using a Probability Proportional to Size (PPS) approach. Due to fieldwork constraints and the geographically dispersed nature of farms and enterprises, the survey was implemented using a non-probability convenience sampling procedure. The satisfaction index was constructed based on 16 Likert-scale items. Responses were transformed into intuitionistic fuzzy values, and a Modified Intuitionistic Fuzzy TOPSIS (MIF-TOPSIS) procedure was applied to obtain the Individual Satisfaction Index and to enable spatial comparison across districts.
Results
The results indicate that the overall level of beneficiary satisfaction with the IPARD programme in Denizli Province is generally high, although moderate spatial variation across districts is observed. The mean scores indicate generally high levels of satisfaction, with most district averages ranging between 0.74 and 0.86, while values extend from 0.70 to 0.94. The highest values are observed in Bozkurt and Pamukkale (0.94) and Buldan (0.92). By contrast, the lowest average satisfaction level is recorded in Honaz (0.70), followed by Baklan (0.74), Çal (0.77), and Çivril (0.78), which are districts with larger numbers of respondents.
Conclusions
The study shows that the MIF-TOPSIS approach provides a framework for transforming subjective Likert-scale responses into a composite satisfaction index and allows for spatial comparison across districts. Beneficiary satisfaction with the IPARD programme is generally high, although moderate spatial variation is observed. The findings indicate that satisfaction is influenced by local implementation conditions, administrative experiences, and project-level processes. Regular assessment of beneficiary satisfaction provides important feedback for improving programme implementation and aligning support measures with local needs.
Keywords
EU IPARD programme, beneficiary satisfaction, rural development, Intuitionistic Fuzzy TOPSIS, spatial variation
Cel
Celem badania jest ocena, czy wskaźniki zaangażowania konsumentów w czasie rzeczywistym, takie jak aktywność graczy na platformie Steam oraz popularność transmisji na Twitch, mogą wyprzedzać i wyjaśniać krótkookresowe reakcje rynku kapitałowego. Analiza koncentruje się na spółce CD Projekt i obejmuje dwa kluczowe tytuły: The Witcher 3 oraz Cyberpunk 2077, które stanowią istotne wydarzenia rynkowe o zróżnicowanej dynamice zainteresowania użytkowników.
Metody
Badanie opiera się na dziennych danych wtórnych z okresu od 18.05.2015 do 24.12.2025. Wykorzystano notowania akcji CD Projekt (Stooq) oraz wskaźniki zaangażowania użytkowników: liczbę graczy na Steam (SteamDB) oraz statystyki oglądalności na Twitch (TwitchTracker). Wszystkie szeregi czasowe sprowadzono do wspólnej częstotliwości dziennej i zsynchronizowano, uwzględniając braki danych oraz dni bez notowań giełdowych. W celu poprawy porównywalności zmiennych zastosowano transformacje: logarytmowanie, standaryzację oraz różnicowanie, co ograniczyło problem niestacjonarności. Analiza skupia się na krótkookresowej dynamice zależności, a nie na relacjach długookresowych. Metodyka obejmuje analizę korelacji krzyżowej (CCF) do identyfikacji zależności opóźnionych oraz modele zmiennych opóźnionych, umożliwiające ocenę wpływu aktywności użytkowników na rynek finansowy i wykrycie efektów wyprzedzających. Dodatkowo przeprowadzono analizę zdarzeń (event study) dla kluczowych premier, aktualizacji i powiązanych produkcji medialnych. Badanie stanowi pełną obserwację danych publicznych bez doboru próby. Wnioskowanie statystyczne obejmuje testy istotności parametrów oraz ocenę siły i kierunku zależności. Analizę wykonano oddzielnie dla gier The Witcher 3 i Cyberpunk 2077, co pozwala porównać różnice w dynamice zaangażowania graczy oraz reakcji rynku giełdowego dla obu kluczowych marek studia.
Wyniki
Wstępne wyniki wskazują na istotne zróżnicowanie dynamiki zależności pomiędzy analizowanymi tytułami. W przypadku Cyberpunk 2077 obserwuje się silniejsze i bardziej gwałtowne reakcje zarówno w danych dotyczących aktywności użytkowników, jak i w notowaniach giełdowych, szczególnie w okresach związanych z dodatkami oraz premierą serialu Edgerunners. Dla The Witcher 3 zależności mają charakter bardziej stabilny i rozłożony w czasie. Analiza korelacji krzyżowej wskazuje na występowanie opóźnień pomiędzy zmianami aktywności graczy a reakcjami cen akcji, co sugeruje potencjalny efekt wyprzedzający. Jednocześnie w okresie premier zaobserwowano przypadki spadków kursu mimo wysokiego poziomu zainteresowania użytkowników.
Wnioski
Formułuje się hipotezy dotyczące zależności pomiędzy wskaźnikami zaangażowania użytkowników a reakcjami rynku kapitałowego. Zakłada się, że zmiany aktywności graczy oraz popularności transmisji mogą wyprzedzać krótkookresowe zmiany cen akcji oraz odzwierciedlać nastroje inwestorów. Oczekuje się również, że charakter tych zależności różni się w zależności od analizowanego tytułu oraz rodzaju wydarzenia rynkowego. Badanie wskazuje na potencjalną przydatność danych alternatywnych w analizie ekonomicznej oraz ich zastosowanie jako uzupełniającego źródła informacji w modelowaniu krótkookresowych reakcji rynku.
Słowa kluczowe:
dane alternatywne, rynki kapitałowe, CD Projekt, Twitch, Steam
Pobierz prezentację (pdf, 114 kB)Objective
The aim of this study is to assess whether real-time consumer engagement metrics, such as player activity on Steam and streaming popularity on Twitch, can anticipate and explain short-term reactions in financial markets. The analysis focuses on CD Projekt and covers two major titles, The Witcher 3 and Cyberpunk 2077, which represent significant market events characterized by differing patterns of user engagement dynamics.
Methods
The study utilizes secondary daily data from May 18, 2015, to December 24, 2025. The dataset integrates CD Projekt stock prices from Stooq with consumer engagement metrics: active player counts on Steam (SteamDB) and viewership statistics on Twitch (TwitchTracker). All time series were synchronized to a daily frequency, with missing data and non-trading days addressed through standard alignment procedures to ensure dataset consistency. For better comparability and statistical robustness, variables underwent transformations, including logarithmic scaling, standardization, and differencing to address non-stationarity. The analysis prioritizes short-term dynamics over long-term equilibrium. The framework employs cross-correlation function (CCF) analysis to detect lagged dependencies between engagement indicators and stock prices. Furthermore, lagged variable models evaluate how prior user activity impacts financial reactions, identifying potential leading indicators. Additionally, an event study methodology examines market responses to key milestones, such as game launches, expansions, updates, and media releases. The research constitutes a full observation of public data rather than a sample. Statistical inference involves significance testing of model parameters and evaluating the strength and direction of relationships. Analysis is performed separately for The Witcher 3 and Cyberpunk 2077 to compare engagement patterns and market responses.
Results
Preliminary findings indicate significant differences in the dynamics of relationships between the analyzed titles. In the case of Cyberpunk 2077, stronger and more volatile reactions are observed both in user activity data and stock market performance, particularly during periods associated with expansions and the release of the Edgerunners series. In contrast, The Witcher 3 exhibits more stable and gradually evolving patterns. Cross-correlation analysis suggests the presence of lagged effects between user activity and stock price movements, indicating a potential leading role of engagement metrics. At the same time, during release periods, instances of declining stock prices were observed despite high levels of user interest.
Conclusions
The study formulates hypotheses regarding the relationship between consumer engagement metrics and financial market reactions. It is assumed that changes in player activity and streaming popularity may precede short-term stock price movements and reflect investor sentiment. Differences in the strength and nature of these relationships are expected depending on the analyzed title and the type of market event. The study highlights the potential usefulness of alternative data in economic analysis and their application as a complementary source of information in modeling short-term market reactions
Keywords
alternative data, capital markets, CD Projekt, Twitch, Steam
Cel
Celem referatu jest prezentacja koncepcji nowej metodyki uogólniania wyników w badaniu DG-1 z wykorzystaniem metody reprezentacyjnej. Dotychczasowa metodyka, oparta na wskaźniku uogólniania bazującym na liczbie pracujących, nie pozwala na pełne wykorzystanie aparatu metody reprezentacyjnej do oceny jakości oszacowań. Nowe podejście obejmuje modyfikację schematu losowania i alokacji próby, wykorzystanie metody cut-off sampling, implementację estymacji kalibracyjnej oraz opracowanie metody oceny jakości oszacowań.
Metody
Badaniem DG-1 objęte są przedsiębiorstwa niefinansowe (przemysł, budownictwo, transport, handel, usługi) zatrudniające 10 i więcej osób. W styczniu 2025 r. populacja liczyła 113 361 jednostek. Aktualnie do próby brane są wszystkie jednostki duże (zatrudniające co najmniej 50 osób) oraz minimum 10-procentowa próba spośród przedsiębiorstw średnich (zatrudniających 10-49 osób), losowana z warstwowaniem według województwa, sekcji, działu i grupy PKD oraz sektora własności. W celu oceny proponowanych modyfikacji metodyki przeprowadzono badanie symulacyjne metodą Monte Carlo (500 replikacji). Pseudo-populację skonstruowano poprzez połączenie kartoteki DG-1 ze stycznia 2025 r. z jednostkowymi danymi z rejestru VAT po numerze REGON (103 028 jednostek, 90,9% poprawnych połączeń). Zmienną badaną była sprzedaż. Testowano łącznie 128 schematów losowania, różniących się alokacją próby (proporcjonalną do liczebności warstw oraz pierwiastkową), minimalną liczebnością warstwy oraz punktami podziału metody cut-off sampling, przy stałej wielkości próby równej 25 000 jednostek. Zastosowano estymację kalibracyjną z liczbą pracujących jako zmienną pomocniczą, w podziale województwo i sekcja PKD. Jakość oszacowań oceniono empirycznie za pomocą względnego obciążenia, względnego błędu standardowego oraz względnego pierwiastka błędu średniokwadratowego.
Wyniki
Analiza populacji DG-1 ujawniła silną prawostronną asymetrię rozkładów: jednostki o liczbie pracujących 10-49 osób stanowią 81,8% populacji, ale skupiają tylko 26,2% pracujących, podczas gdy jednostki zatrudniające co najmniej 1000 osób (0,6% populacji) obejmują 27,4% pracujących. Problem braków odpowiedzi dotyczy głównie najmniejszych przedsiębiorstw - około 40% w grupie zatrudniającej 10-19 osób wobec około 2% w grupie największych jednostek. Wyniki badania symulacyjnego wskazują, że alokacja pierwiastkowa prowadzi do mniejszego względnego błędu standardowego niż alokacja proporcjonalna do liczebności warstw, a odpowiednio dobrane punkty podziału metody cut-off sampling poprawiają precyzję ocen przy akceptowalnym obciążeniu.
Wnioski
Uogólnianie wyników w DG-1 na bazie metody reprezentacyjnej będzie możliwe wyłącznie w wybranych przekrojach, w których uzyska się akceptowalną jakość oszacowań. Wprowadzenie metody cut-off sampling wraz z alokacją pierwiastkową oraz estymacją kalibracyjną pozwala poprawić precyzję ocen przy jednoczesnym zmniejszeniu obciążenia respondentów, zwłaszcza najmniejszych przedsiębiorstw, najbardziej dotkniętych zjawiskiem braków odpowiedzi. Opracowane podejście może znaleźć zastosowanie w innych badaniach z zakresu statystyki przedsiębiorstw realizowanych w ramach statystyki publicznej.
Słowa kluczowe:
badanie DG-1, metoda reprezentacyjna, cut-off sampling, estymacja kalibracyjna, statystyka przedsiębiorstw
Pobierz prezentację (docx, 19 kB)Objective
The aim of this paper is to present the concept of a new methodology for the generalisation of results in the DG-1 survey using the sampling method. The current methodology, based on a generalisation factor relying on the number of employed persons, does not allow for the full application of the sampling method apparatus for assessing the quality of estimates. The new approach includes modifying the sampling scheme and sample allocation, applying the cut-off sampling method, implementing calibration estimation, and developing a method for assessing the quality of estimates.
Methods
The DG-1 survey covers non-financial enterprises (industry, construction, transport, trade, services) employing 10 or more persons. In January 2025, the population consisted of 113,361 units. Currently, all large units (employing at least 50 persons) are included in the sample, together with a minimum 10% sample of medium-sized enterprises (employing 10–49 persons), drawn with stratification by voivodeship, NACE section, division and group, and ownership sector. In order to evaluate the proposed methodological modifications, a simulation study was carried out using the Monte Carlo method (500 replications). The pseudo-population was constructed by linking the DG-1 register from January 2025 with unit-level data from the VAT register using the REGON identifier (103,028 units, 90.9% correctly linked). The study variable was sales. A total of 128 sampling schemes were tested, differing in sample allocation (proportional to stratum sizes and square-root allocation), minimum stratum sample size, and cut-off sampling thresholds, with a fixed sample size of 25,000 units. Calibration estimation was applied with the number of employed persons as the auxiliary variable, by voivodeship and NACE section. The quality of the estimates was assessed empirically using relative bias, relative standard error, and relative root mean square error.
Results
The analysis of the DG-1 population revealed a strong right-skewed distribution: units employing 10–49 persons account for 81.8% of the population but only 26.2% of employed persons, whereas units employing at least 1,000 persons (0.6% of the population) account for as much as 27.4% of employed persons. The problem of non-response mainly concerns the smallest enterprises – approximately 40% in the group employing 10–19 persons compared with approximately 2% in the group of the largest units. The results of the simulation study indicate that square-root allocation leads to a lower relative standard error than allocation proportional to stratum sizes, and that appropriately chosen cut-off sampling thresholds improve the precision of the estimates with an acceptable level of bias.
Conclusions
The generalisation of results in the DG-1 survey based on the sampling method will be possible only in selected domains in which an acceptable quality of estimates can be achieved. The introduction of the cut-off sampling method together with square-root allocation and calibration estimation makes it possible to improve the precision of the estimates while at the same time reducing the response burden, especially for the smallest enterprises, which are most affected by the problem of non-response. The proposed approach may find application in other business statistics surveys carried out within official statistics.
Keywords
DG-1 survey, sampling method, cut-off sampling, calibration estimation, business statistics
Cel
Celem badania jest opracowanie szybkiego, operacyjnego wskaźnika komponentu krajowego dla polskich przedsiębiorstw, opartego na administracyjnych źródłach danych i możliwego do zastosowania na poziomach mikro i makro. Badanie ma na celu oszacowanie krajowego udziału w łańcuchach dostaw, uwzględnienie wielopoziomowych struktur dostawców oraz dostarczenie skalowalnego narzędzia do analiz ekonomicznych, przy jednoczesnym uwzględnieniu ograniczeń istniejących podejść międzynarodowych.
Metody
Metodologia łączy administracyjne mikrodane z systemu JPK_VAT z reprezentacją łańcuchów dostaw w postaci drzewa skierowanego. Sieć dostawców jest identyfikowana poprzez numery REGON. Dla każdej firmy obliczany jest wskaźnik Local Content Score LCS(t1,t2,D) dla okresu (t1,t2) i głębokości D. Dla D=1 wskaźnik równy jest udziałowi zakupów krajowych w całkowitych zakupach towarów i usług. Dla D*1 wskaźnik uwzględnia ważone wkłady LCS(D-1) kluczowych dostawców krajowych, wybieranych według reguł statystycznych (np. top N dostawców lub dostawcy generujący łącznie x% zakupów). Łańcuch dostaw modelowany jest jako skierowane drzewo acykliczne z unikalną ścieżką od firmy centralnej do każdego dostawcy. W przypadku krótkiego łańcucha dostaw, skierowane drzewo acykliczne jest bardzo precyzyjnym modelem rzeczywistych przepływów. Im dłuższy łańcuch dostaw, tym częściej występują niejednoznaczne ścieżki od dostawcy do finalnego odbiorcy oraz wzajemne przepływy. Wskaźnik jest ograniczony do przedziału [0,1] i maleje wraz z głębokością łańcucha dostaw. Dla analiz sektorowych oceniane są dwa podejścia agregacyjne: top down i bottom up. Podejście podkreśla automatyzację i niezależność od danych ankietowych.
Wyniki
W prezentacji zostaną przedstawione przykładowe wyniki wskaźnika Local Content Score (LCS) dla wybranych branż, ukazujące zachowanie wskaźnika na różnych poziomach głębokości łańcucha dostaw (tiers). Dla każdego sektora zaprezentowane zostaną wartości LCS dla D=1, odzwierciedlające bezpośrednie zakupy krajowe, oraz dla wyższych poziomów (D*1), które uwzględniają krajowe komponenty zawarte w działalności kluczowych dostawców. Przykłady pokażą tempo spadku wartości wskaźnika wraz ze wzrostem głębokości łańcucha dostaw w różnych branżach. Omówione zostaną również różnice między branżami - sektory o skoncentrowanej strukturze dostawców wykazują wyższy wielopoziomowy komponent krajowy, podczas gdy sektory bardziej rozproszone lub importochłonne charakteryzują się szybszym spadkiem LCS.
Wnioski
Proponowany wskaźnik LCS stanowi praktyczne i statystycznie solidne narzędzie do oceny krajowego komponentu w łańcuchach dostaw z wykorzystaniem istniejących danych administracyjnych. Wspiera tworzenie polityk opartych na dowodach w obszarach takich jak strategia przemysłowa, zamówienia publiczne czy bezpieczeństwo gospodarcze. Pomimo ograniczeń wynikających z braku informacji o przedmiocie transakcji oraz o narodowości kapitału własnościowego w JPK_VAT, metoda umożliwia skalowalne i zautomatyzowane monitorowanie krajowego udziału w różnych sektorach. Jej elastyczność i interpretowalność czynią ją wartościowym narzędziem w analizie komponentu krajowego.
Słowa kluczowe:
local content: komponent krajowy: łańcuchy dostaw: dane administracyjne
Pobierz prezentację (docx, 23 kB)Objective
The objective of this study is to develop a quick-to-estimate, operational indicator of local content for Polish enterprises, based on administrative data sources and applicable across sectors. The research aims to quantify the domestic share of supply chains, incorporate multi-tier supplier structures, and provide a scalable tool for policy analysis, while addressing the limitations of existing international approaches.
Methods
The methodology combines administrative microdata from the JPK_VAT system with a directed-tree representation of supply chains. Suppliers network is identified through REGON identifiers. For each enterprise, the Local Content Score LCS(t1,t2,D) is computed for period (t1,t2) and depth D. For D=1, the score equals the share of domestic purchases in total purchases of goods and services. For D*1, the score incorporates weighted contributions of key domestic suppliers’ own LCS(D-1), where key suppliers are selected using statistical rules (e.g., top-N suppliers or suppliers generating x% of total purchases). The supply chain is modelled as a directed acyclic tree with a unique path from the focal firm to each supplier. When short supply chain is considered, the directed acyclic tree is a very precise model of real flows. The longer the supply chain, the more frequent non-unique paths from supplier to focal firm occur. The indicator is mathematically bounded in [0,1] and monotonically decreasing with depth. Two aggregation strategies: top-down and bottom-up, are evaluated for sector-level analysis. The approach emphasizes automation, scalability, and independence from survey-based data collection.
Results
The presentation will showcase illustrative Local Content Score (LCS) results for selected industries, highlighting how the indicator behaves across different supply chain depths (tiers). For each sector, LCS values will be reported for D=1, capturing direct domestic sourcing, and for higher tiers (D*1), which incorporate domestic inputs embedded in the operations of key suppliers. The examples will demonstrate how the score systematically declines with increasing depth, reflecting the diminishing visibility of domestic components further along the supply chain. Differences across industries will also be discussed, showing how sectors with concentrated supplier structures exhibit higher multi-tier domestic content, while more fragmented or import-intensive sectors display steeper declines.
Conclusions
The proposed LCS offers a practical and statistically robust tool for assessing domestic content in supply chains using existing administrative data. It supports evidence-based policymaking in areas such as industrial strategy, procurement, and economic security. While limited by the absence of product details and nationality of equity in JPK_VAT, the method enables scalable, automated monitoring of domestic participation across sectors. Its flexibility and interpretability make it a valuable contribution to the statistical toolkit for analyzing local content.
Keywords
local content: supply chains: administrative data
Cel
Celem artykułu jest identyfikacja i ocena dynamicznych zależności między inflacją producencką a krótkookresowymi dostosowaniami należnościowo-kredytowymi sektora przetwórstwa przemysłowego w Polsce. Problem badawczy koncentruje się na pytaniu, czy zmiany inflacji producenckiej wyprzedzają zmiany należności oraz kredytów i pożyczek krótkoterminowych, a także czy między tymi kategoriami finansowymi występują istotne zależności dynamiczne.
Metody
Badanie opiera się na kwartalnych danych dla Polski obejmujących lata 2014–2025. Inflacja producencka została zmierzona wskaźnikiem cen produkcji sprzedanej przemysłu. Krótkookresowe dostosowania finansowe ujęto za pomocą dwóch zmiennych pochodzących ze sprawozdania RF-01 (kwartalne statystyczne sprawozdanie o aktywach i pasywach finansowych) Głównego Urzędu Statystycznego i analizowanych na poziomie sektora przetwórstwa przemysłowego: należności, przybliżonych wartością pozycji „pozostałe kwoty do otrzymania”, oraz kredytów i pożyczek z terminem pierwotnym do jednego roku. W analizie zastosowano model wektorowej autoregresji (VAR), umożliwiający badanie współzależności dynamicznych między trzema zmiennymi traktowanymi jako endogeniczne. W celu identyfikacji kierunku zależności wykorzystano testy przyczynowości w sensie Grangera oraz procedurę Toda–Yamamoto, która pozwala prowadzić wnioskowanie przy mniej restrykcyjnych założeniach dotyczących rzędów integracji analizowanych szeregów czasowych. Z uwagi na relatywnie niewielką liczebność próby zastosowano również procedurę wild bootstrap, wzmacniającą wiarygodność wnioskowania statystycznego. Przed estymacją przeprowadzono weryfikację własności szeregów czasowych oraz dobór opóźnień modelu, tak aby ograniczyć ryzyko błędnej specyfikacji i zapewnić większą porównywalność uzyskanych wyników.
Wyniki
Przeprowadzona analiza wskazuje, że inflacja producencka może być powiązana z krótkookresowymi dostosowaniami należnościowo-kredytowymi w sektorze przetwórstwa przemysłowego w Polsce, chociaż siła i kierunek tych zależności mogą się różnić w zależności od specyfikacji modelu. Uzyskane wyniki stanowią podstawę do oceny, czy wzrost cen producentów wyprzedza zmiany należności, czy wiąże się ze zmianami skali wykorzystania kredytów i pożyczek krótkoterminowych oraz czy między należnościami a finansowaniem krótkoterminowym występują istotne zależności dynamiczne. Otrzymane rezultaty pozwalają także porównać znaczenie obu analizowanych kanałów dostosowawczych w reakcji sektora na presję cenową.
Wnioski
Wkład referatu polega na połączeniu perspektywy makroekonomicznej i finansowej w analizie krótkookresowych mechanizmów dostosowawczych sektora przetwórstwa przemysłowego. Badanie wpisuje się w nurt analiz dotyczących transmisji impulsów cenowych do krótkoterminowych pozycji finansowych i może stanowić punkt odniesienia dla dalszych badań nad zależnościami między zmianami cen a krótkoterminową sytuacją finansową sektora przetwórstwa przemysłowego w Polsce. Uzyskane wyniki mogą być użyteczne także dla instytucji monitorujących kondycję sektora przedsiębiorstw, w szczególności przetwórstwa przemysłowego, w Polsce.
Słowa kluczowe:
finanse przedsiębiorstw, należności, kredyt krótkoterminowy, wektorowa autoregresja, przyczynowość w sensie Grangera
Pobierz prezentację (docx, 17 kB)Objective
The aim of the paper is to identify and assess the dynamic relationships between producer price inflation and short-term receivables and credit adjustments in the manufacturing sector in Poland. The research problem focuses on whether changes in producer price inflation precede changes in receivables and short-term credit and loans, and whether significant dynamic relationships exist between these financial categories.
Methods
The study is based on quarterly data for Poland covering the period 2014–2025. Producer price inflation is measured by the producer price index. Short-term financial adjustments are captured by two variables derived from RF-01 (quarterly report on financial assets and liabilities) reports of Statistics Poland and analysed at the level of the manufacturing sector: receivables, proxied by the value of the item “other amounts receivable”, and credit and loans with an original maturity of up to one year. The analysis applies a vector autoregression (VAR) model, which makes it possible to examine dynamic interdependencies among three variables treated as endogenous. To identify the direction of relationships, Granger causality tests and the Toda–Yamamoto procedure are used: the latter allows inference under less restrictive assumptions regarding the orders of integration of the analysed time series. Given the relatively small sample size, a wild bootstrap procedure is also employed to strengthen the reliability of statistical inference. Prior to estimation, the time-series properties of the variables and the lag structure of the model are verified in order to reduce the risk of misspecification and improve the comparability of the results.
Results
The conducted analysis indicates that producer price inflation may be related to short-term receivables and credit adjustments in the manufacturing sector in Poland, although the strength and direction of these relationships may vary depending on the model specification. The obtained results provide a basis for assessing whether increases in producer prices precede changes in receivables, whether they are associated with changes in the scale of the use of short-term credit and loans, and whether significant dynamic relationships exist between receivables and short-term financing. The findings also make it possible to compare the relative importance of the two adjustment channels in the sector’s response to price pressure.
Conclusions
The contribution of the paper lies in combining a macroeconomic and a financial perspective in the analysis of short-term adjustment mechanisms in the manufacturing sector. The study fits into the stream of research on the transmission of price impulses to short-term financial positions and may serve as a reference point for further studies on the relationships between price changes and the short-term financial condition of the manufacturing sector in Poland. The findings may also be useful for institutions monitoring the condition of the enterprise sector, particularly manufacturing, in Poland.
Keywords
corporate finance, receivables, short-term credit, vector autoregression, Granger causality
Pobierz prezentację (pdf, 148 kB)Objective
This paper examines discount retail locations as outcomes of firm location choice and as indirect evidence of local consumer-facing market potential. Building on the consumer city perspective (Glaeser, Kolko, * Saiz, 2001), urban economics of retail allocation, retail agglomeration research (Sevtsuk, 2014: Piovani, Zachariadis, * Batty, 2017) and chain store location evidence (Jia, 2008: Holmes, 2011), it asks whether Lidl and Biedronka supermarkets’ geographies reveal transferable relationships between population, accessibility, amenities, barriers and private location suitability.
Methods
The study uses reproducible spatial sources: OpenStreetMap urban feature channels, an NSP 2021 Census Grid population channel from GUS at 250m granularity and observed supermarket store locations within Polish city boundaries. The empirical object is a rasterized urban surface. Layers are projected to EPSG:2180 and harmonized to a 50 m modelling grid: population is resampled and interpreted at the source-grid level, not as directly observed 50 m population. Lidl and Biedronka OSM tags are excluded from explanatory POI channels and used only as target locations. Separate models are trained for each brand. The explanatory tensor contains seven channels: population, roads, rail corridors, water barriers, point-of-interest density, mobility-access proxy and public-amenity density. To reduce spatial leakage, the design uses cross-city validation: Warszawa, Łódź and Gdańsk form the training set: Kraków, Poznań and Białystok the validation set: Wrocław, Szczecin and Bydgoszcz the test set. Following spatial machine-learning arguments about spatial dependence and transferability (Kopczewska, 2022), the model estimates a brand-specific store location suitability surface. The main estimator is a conditional GAN: the generator maps context rasters into predicted store-presence surfaces, while the discriminator evaluates their spatial plausibility given the same context. Evaluation combines pixel loss with count error, count bias, mass bias, cluster morphology, Moran’s I and Geary’s C.
Results
Preliminary diagnostics indicate that observed discount retail geography is not reducible to residential population alone. Economically informative store presence surfaces emerge where population support coincides with road accessibility, POI intensity, public amenities and limited barrier separation. The outputs therefore translate spatial prediction into measures of revealed local-market suitability: where demand-supporting context concentrates, where brand-specific retail mass is expected and where water or rail barriers weaken otherwise dense surroundings. Cross-city errors identify which components of the local market structure are transferable and which remain city specific.
Conclusions
The paper contributes a framework for measuring local urban market potential through revealed discount retail allocation. Predicted store presence surfaces are interpreted as indicators of private firm location suitability: areas that resemble observed store choices under the spatial structure of population, accessibility, amenities and barriers. The claim is empirical rather than normative: the model evaluates how existing retail networks encode local economic activity and how far this logic generalizes across cities. For urban economics and applied statistics, it links consumer city theory, OSM and Census Grid data, spatial ML and autocorrelation diagnostics.
Keywords
local market potential: retail allocation: consumer city: spatial machine learning: generative adversarial networks
Cel
Celem badania jest ocena wpływu zmian liczby cudzoziemców na sytuację ekonomiczno-gospodarczą wybranych powiatów w Polsce w warunkach rosnącej i przestrzennie zróżnicowanej skali migracji po 2019 roku. Analiza wykorzystuje koncepcję „powiatów skojarzonych”, opartą na dopasowaniu jednostek o podobnych charakterystykach w roku bazowym, co pozwala ograniczyć wpływ różnic początkowych i umożliwia bardziej wiarygodne porównanie zmian w czasie.
Metody
W badaniu wykorzystywane są oraz będą dane z systemu OBM oraz Banku Danych Lokalnych (BDL GUS), obejmujące informacje o sytuacji społeczno-ekonomicznej powiatów oraz dane o liczbie i rozmieszczeniu cudzoziemców w Polsce. Analizy są w trakcie realizacji i będą dalej rozwijane w języku R, z wykorzystaniem narzędzi do przetwarzania danych, analizy statystycznej oraz procedur dopasowania jednostek. Kluczowym elementem metodologicznym jest konstrukcja „powiatów skojarzonych”, czyli par jednostek terytorialnych tworzonych na podstawie podobieństwa ich charakterystyk w roku 2019. Procedura dopasowania jest obecnie implementowana i testowana – do wyznaczania podobieństwa wykorzystywana jest miara odległości euklidesowej (z możliwością zastosowania alternatywnych specyfikacji), a jej celem jest minimalizacja globalnej odległości pomiędzy sparowanymi powiatami. Wstępnie wyodrębniono dwie grupy jednostek: 10 powiatów o najwyższej liczbie cudzoziemców oraz 10 powiatów o najniższej ich liczbie. Ostateczna konstrukcja par oraz ich walidacja są w toku. Takie podejście ma pozwolić na kontrolę początkowych różnic strukturalnych i bardziej precyzyjną ocenę zmian w czasie, w szczególności w okresie 2019–2024 (oraz częściowo 2025, w zależności od dostępności danych).
Wyniki
Dotychczasowe, wstępne analizy wskazują na możliwe zróżnicowanie tempa zmian sytuacji ekonomiczno-gospodarczej w badanych powiatach w zależności od poziomu obecności cudzoziemców. Obserwowane są sygnały sugerujące odmienne trajektorie zmian wybranych wskaźników pomiędzy powiatami o wysokiej i niskiej koncentracji cudzoziemców, jednak wyniki te wymagają dalszej weryfikacji i pogłębionej analizy. Podejście oparte na „powiatach skojarzonych” jest obecnie oceniane pod kątem swojej użyteczności w ograniczaniu wpływu różnic początkowych i lepszym uchwyceniu potencjalnych zależności pomiędzy migracją a zmianami społeczno-ekonomicznymi.
Wnioski
Zastosowane podejście ma potencjał umożliwienia bardziej precyzyjnej analizy wpływu zmian liczby cudzoziemców na sytuację lokalnych gospodarek, jednak na obecnym etapie badania wnioski mają charakter wstępny. Dalsze prace będą obejmować rozwinięcie analiz oraz zastosowanie bardziej zaawansowanych metod ekonometrycznych. Ostateczne wyniki mogą stanowić wkład do literatury dotyczącej ekonomii regionalnej oraz analiz migracyjnych, a także znaleźć zastosowanie w politykach publicznych na poziomie lokalnym. Praca ma charakter eksploracyjny i stanowi punkt wyjścia do dalszych badań.
Słowa kluczowe:
analiza przestrzenna, cudzoziemcy, powiaty skojarzone.
Pobierz prezentację (docx, 21 kB)Objective
The aim of the study is to assess the impact of changes in the number of foreign nationals on the economic situation of selected counties in Poland in the context of the growing and spatially differentiated scale of migration after 2019. The analysis employs the concept of “matched counties,” based on pairing units with similar characteristics in the base year, which allows for reducing the influence of initial differences and enables more reliable comparisons over time.
Methods
The study uses data from the OBM system and the Local Data Bank of Statistics Poland (BDL GUS), including information on the socio-economic situation of counties as well as data on the number and distribution of foreign nationals in Poland. The analyses are currently ongoing and are being further developed in R, using tools for data processing, statistical analysis, and matching procedures. A key methodological element is the construction of “matched counties,” i.e., pairs of territorial units formed based on the similarity of their characteristics in 2019. The matching procedure is currently being implemented and tested. Similarity is measured using the Euclidean distance (with possible alternative specifications), with the objective of minimizing the overall distance between paired counties. Two groups of units have been preliminarily identified: 10 counties with the highest and 10 with the lowest number of foreign nationals. The final construction and validation of pairs are still in progress. This approach allows for controlling initial structural differences and provides a more precise assessment of changes over time, particularly in the period 2019–2024 (and partially 2025, depending on data availability).
Results
Preliminary findings indicate potential differences in the pace of changes in the economic situation of the analyzed counties depending on the level of foreign population presence. There are signals suggesting distinct trajectories of selected indicators between counties with high and low concentrations of foreign nationals: however, these results require further verification and more in-depth analysis. The “matched counties” approach is currently being evaluated in terms of its effectiveness in reducing the impact of initial differences and better capturing potential relationships between migration and socio-economic changes.
Conclusions
The applied approach has the potential to enable a more precise analysis of the impact of changes in the number of foreign nationals on local economies: however, at the current stage, the conclusions remain preliminary. Further work will involve extending the analysis and applying more advanced econometric methods. The final results may contribute to the literature on regional economics and migration studies, as well as inform public policy at the local level. The study is exploratory in nature and provides a foundation for further research
Keywords
spatial analysis, foreign nationals, matched counties
Cel
Celem głównym badań była ocena zależności między funkcjonalnym powiązaniem gmin wiejskich i miejsko-wiejskich z większymi ośrodkami miejskimi a poziomem inwestycji w gospodarkę niskoemisyjną, współfinansowanych ze środków UE w latach 2007–2013 oraz 2014–2020. Badania empiryczne przeprowadzono w celu weryfikacji hipotezy badawczej zakładającej, że „gminy funkcjonalnie powiązane z dużymi ośrodkami miejskimi (położone w granicach FUA) wykazują wyższy poziom inwestycji w rozwój gospodarki niskoemisyjnej niż gminy znajdujące się poza tymi obszarami”.
Metody
Zakres podmiotowy i terytorialny badań objął wszystkie gminy wiejskie i miejsko-wiejskie w Polsce – łącznie 2175 gmin. Źródłem danych o projektach współfinansowanych ze środków UE w obszarze „Gospodarka niskoemisyjna” była baza danych jednostkowych Ministerstwa Funduszy i Polityki Regionalnej. W badaniach wykorzystano również dane Głównego Urzędu Statystycznego (GUS), obejmujące Bank Danych Lokalnych oraz „Delimitację Obszarów Wiejskich” (DOW). Typologia ta umożliwia wyodrębnienie gmin według ich powiązań funkcjonalnych z ośrodkami miejskimi, dzieląc je na gminy aglomeracyjne i pozaaglomeracyjne. W pierwszym etapie badań analizie poddano liczbę i wartość pozyskanych projektów w obszarze gospodarki niskoemisyjnej (w ujęciu bezwzględnym, per capita, oraz per km2) przez gminy według klasyfikacji DOW i województwa. W tym etapie badań zastosowano metody statystyki opisowej oraz wnioskowania statystycznego, oparte na testach istotności różnic. W drugim etapie badań zastosowano analizę korespondencji, umożliwiającą graficzne odwzorowanie relacji między kategoriami zmiennych w przestrzeni dwuwymiarowej. Dane wejściowe miały postać tabeli kontyngencji obejmującej dwie zmienne: (1) typ gminy według przynależności do FUA i województwa (łącznie 32 jednostki) oraz (2) poziom inwestycji w gospodarkę niskoemisyjną. Zmienną ilościową dotyczącą poziomu inwestycji (na mieszkańca i jednostkę powierzchni) skategoryzowano do czterech klas opartych na kwartylach rozkładu.
Wyniki
Powiązania funkcjonalne badanych gmin z dużymi ośrodkami miejskimi istotnie różnicują ich aktywność inwestycyjną w zakresie rozwoju gospodarki niskoemisyjnej. Analiza korespondencji ujawniła wyraźne rozróżnienie między gminami aglomeracyjnymi a pozaaglomeracyjnymi, potwierdzając ważną rolę czynnika funkcjonalnego. Gminy w obrębie FUA częściej realizują inwestycje na poziomie umiarkowanym (niskim lub średnim), natomiast poza FUA dominują układy skrajne – od braku działań po wysoką intensywność. Układ ten odpowiada mechanizmom polaryzacji centrum–peryferie. Analiza miar dyspersji wskazuje, że gminy pozaaglomeracyjne charakteryzują się większym zróżnicowaniem poziomu inwestycji w gospodarkę niskoemisyjną.
Wnioski
W świetle uzyskanych wyników zasadne wydaje się sformułowanie kilku rekomendacji. Wskazane jest prowadzenie polityki rozwojowej o zróżnicowanym charakterze, dostosowanej do typu i lokalizacji gmin. Kluczowe znaczenie ma wzmacnianie potencjału instytucjonalnego gmin pozaaglomeracyjnych – zwłaszcza tych, które nie wykazują aktywności w zakresie transformacji energetycznej. Wymaga to nie tylko wsparcia finansowego, lecz także zapewnienia dostępu do doradztwa, wiedzy eksperckiej oraz uproszczenia procedur.
Słowa kluczowe:
inwestycje, gospodarka niskoemisyjna, transformacja energetyczna, funkcjonalne obszary miejskie (FUA), delimitacja obszarów wiejskich (DOW)
Pobierz prezentację (pdf, 56 kB)Objective
The main objective of the study was to assess the relationship between the functional linkage of rural and urban-rural municipalities with larger urban centers and the level of investments in the low-emission economy, co-financed by EU funds in the periods 2007–2013 and 2014–2020. The empirical analysis was conducted to verify the research hypothesis that “municipalities functionally linked to large urban centers (located within Functional Urban Areas – FUA) exhibit a higher level of investment in the development of a low-emission economy than municipalities located outside these areas.”
Methods
The study covered all rural and urban-rural municipalities in Poland, totaling 2,175 units. Data on EU co-financed projects in the field of the low-emission economy were obtained from the individual project database of the Ministry of Funds and Regional Policy. The analysis also used data from Statistics Poland (GUS), including the Local Data Bank and the “Delimitation of Rural Areas” (DOW). This typology allows municipalities to be classified according to their functional linkages with urban centers, distinguishing between agglomeration and non-agglomeration municipalities. In the first stage, the number and value of low-emission economy projects acquired by municipalities were analyzed (in absolute terms, per capita, and per km2), according to the DOW classification and voivodeships. Descriptive statistics and statistical inference methods based on significance tests were applied. In the second stage, correspondence analysis was used to graphically represent relationships between variable categories in a two-dimensional space. The input data took the form of a contingency table including two variables: (1) the type of municipality according to its affiliation with FUA and voivodeship (32 units in total), and (2) the level of investment in the low-emission economy. The quantitative variable describing the level of investment (per capita and per area unit) was categorized into four classes based on distribution quartiles.
Results
The functional linkages of the analyzed municipalities with large urban centers significantly differentiate their investment activity in the development of the low-emission economy. Correspondence analysis revealed a clear distinction between agglomeration and non-agglomeration municipalities, confirming the key role of the functional factor. Municipalities within FUAs more often implement investments at a moderate level (low or medium), whereas outside FUAs extreme patterns dominate—from no activity to high intensity. This pattern reflects center–periphery polarization mechanisms. The analysis of dispersion measures indicates that non-agglomeration municipalities are characterized by greater variability in the level of low-emission investments.
Conclusions
Development policy should be differentiated and tailored to the type and location of municipalities. It is particularly important to strengthen the institutional capacity of non-agglomeration municipalities, especially those less active in the energy transition, through financial support, advisory services, and simplified procedures. At the same time, agglomeration municipalities should be encouraged to undertake more ambitious pro-climate actions, while continued support for peripheral areas should be maintained.
Keywords
investments, energy transition, low-emission economy, Functional Urban Areas (FUA), Delimitation of Rural Areas (DOW)
Cel
Celem badania jest identyfikacja siły, kierunku oraz zmienności w czasie oddziaływania cen producenta i cen importera na wskaźnik cen produktów żywnościowych w Polsce. Analiza obejmuje wybrane produkty roślinne i zwierzęce nieprzetworzone. Dodatkowym celem jest określenie, w jakich okresach inflacja cen żywności była determinowana przez zmiany cen producenta lub importera, a także ocena wzajemnych relacji i sprzężeń zwrotnych między tymi kategoriami cen w różnych horyzontach czasowych.
Metody
W badaniu zastosowano analizę falkową jako narzędzie umożliwiające jednoczesną analizę zależności w czasie i w dziedzinie częstotliwości. Podejście to pozwala na identyfikację zmiennych w czasie powiązań między dynamiką cen producenta, importera oraz W badaniu zastosowano analizę falkową jako narzędzie umożliwiające jednoczesną analizę zależności w czasie i w dziedzinie częstotliwości. Podejście to pozwala na identyfikację zmiennych w czasie powiązań między dynamiką cen producenta, importera oraz konsumenta, a także na określenie kierunku przepływu impulsów cenowych. W szczególności wykorzystano ciągłą transformację falkową oraz analizę koherencji falkowej do badania siły współzależności oraz przesunięć fazowych pomiędzy analizowanymi szeregami czasowymi. Dane empiryczne obejmują miesięczne indeksy cen dla Polski pochodzące z bazy Eurostatu „Food price monitoring tool” (https: / / doi.org / 10.2908 / PRC_FSC_IDX) i dotyczą okresu od stycznia 2005 roku do grudnia 2025 roku, przy czym liczba obserwacji różni się w zależności od produktu i dostępności danych (od n=180 do n=240). Analizie poddano wybrane produkty żywnościowe nieprzetworzone, zarówno pochodzenia roślinnego, jak i zwierzęcego. Uzupełnieniem badania jest wykonanie testu przyczynowości w sensie Grangera, aby potwierdzić wyniki analizy falkowa. W celu zapewnienia porównywalności zastosowano odpowiednie procedury wstępnego przygotowania danych, w tym dyskusję o filtrację składników sezonowych.
Wyniki
Uzyskane wyniki wskazują na istotne zróżnicowanie zależności pomiędzy cenami producenta, importera i konsumenta w zależności od rodzaju produktu. Analiza falkowa umożliwiła dekompozycję tych zależności na komponenty krótkookresowe, średniookresowe i długookresowe, ujawniając zmienność siły powiązań w czasie. W wielu przypadkach obserwuje się okresy dominacji wpływu cen producenta, szczególnie w długich cyklach, podczas gdy w krótszych horyzontach istotną rolę odgrywają ceny importera. Wyniki wskazują również na występowanie przesunięć fazowych, które pozwalają identyfikować opóźnienia w transmisji impulsów cenowych między analizowanymi kategoriami. Zróżnicowanie to jest szczególnie widoczne pomiędzy produktami roślinnymi i zwierzęcymi.
Wnioski
Zastosowanie analizy falkowej pozwala na pogłębioną ocenę mechanizmów kształtowania się cen żywności oraz identyfikację zmiennych w czasie relacji pomiędzy cenami producenta, importera i konsumenta. Wyniki wskazują, że proces transmisji cen ma charakter wieloskładnikowy i zależy od horyzontu czasowego oraz specyfiki produktu. Baza danych Eurostatu „Food price monitoring tool” stanowi wartościowe źródło informacji do tego typu analiz, umożliwiając badanie współzależności w ujęciu dynamicznym. Uzyskane rezultaty mogą być wykorzystane zarówno w analizach makroekonomicznych, jak i w formułowaniu polityki rolnej oraz żywnościowej.
Słowa kluczowe:
analiza falkowa, inflacja, HICP, ceny żywności, transmisja cen
Pobierz prezentację (docx, 17 kB)Objective
The objective of this study is to identify the strength, direction, and temporal variability of the impact of producer and importer prices on the food price index in Poland. The analysis covers selected unprocessed plant and animal products. An additional objective is to determine during which periods food price inflation was driven by changes in producer or importer prices, as well as to assess the interrelationships and feedback loops between these price categories across different time horizons.
Methods
The study employed wavelet analysis as a tool enabling the simultaneous analysis of relationships in both time and the frequency domain. This approach allows for the identification of time-varying relationships between the dynamics of producer, importer, and consumer prices, as well as for determining the direction of price impulse propagation. In particular, continuous wavelet transform and wavelet coherence analysis were used to examine the strength of interdependence and phase shifts between the analyzed time series. The empirical data include monthly price indices for Poland from Eurostat’s “Food price monitoring tool” database (https: / / doi.org / 10.2908 / PRC_FSC_IDX) and cover the period from January 2005 to December 2025, with the number of observations varying depending on the product and data availability (from n=180 to n=240). The analysis covers selected unprocessed food products, both of plant and animal origin. The study is supplemented by a Granger causality test to confirm the results of the wavelet analysis. To ensure comparability, appropriate data preprocessing procedures were applied, including the removal of seasonal components.
Results
The results indicate significant variation in the relationships between producer, importer, and consumer prices depending on the type of product. The wavelet analysis enabled the decomposition of these relationships into short-term, medium-term, and long-term components, revealing the variability of the strength of these relationships over time. In many cases, periods of dominance by producer prices are observed, particularly in long cycles, while importer prices play a significant role in shorter time horizons. The results also indicate the presence of phase shifts, which allow for the identification of delays in the transmission of price shocks between the analyzed categories. This differentiation is particularly evident between plant and animal products.
Conclusions
The use of wavelet analysis allows for an in-depth assessment of the mechanisms underlying food price formation and the identification of time-varying relationships between producer, importer, and consumer prices. The results indicate that the price transmission process is multifaceted and depends on the time horizon and the specific characteristics of the product. Eurostat’s “Food price monitoring tool” database is a valuable source of information for this type of analysis, enabling the examination of interdependencies in a dynamic context. The results obtained can be used both in macroeconomic analyses and in the formulation of agricultural and food policies.
Keywords
wavelet analysis, inflation, HICP, food prices, price transmission
Cel
Celem badania jest określenie, w jakim stopniu wzrost startupów technologicznych w Warszawie zależy od ich cech początkowych oraz od czynników lokalizacyjnych wewnątrz miasta – zarówno absolutnych (np. dostępność infrastruktury), jak i relatywnych (charakterystyka otoczenia i struktura sąsiedztwa). Badanie odpowiada na pytanie, czy znaczenie lokalizacji jest jednorodne, czy też zróżnicowane w zależności od profilu początkowego firmy.
Metody
Badanie opiera się na danych dotyczących startupów technologicznych zlokalizowanych w Warszawie, łączących informacje o ich cechach początkowych (m.in. wielkość, struktura kapitału, zasoby) oraz szczegółowych charakterystykach przestrzennych o ich kontekście wewnątrzmiejskim. W celu redukcji wymiarowości i identyfikacji głównych komponentów opisujących przestrzeń zastosowano analizę głównych składowych (PCA). Następnie wykorzystano modele uczenia maszynowego oparte na drzewach decyzyjnych (XGBoost), które umożliwiają uchwycenie nieliniowych zależności oraz interakcji pomiędzy zmiennymi. W odróżnieniu od klasycznych modeli ekonometrycznych podejście to pozwala analizować heterogeniczne efekty bez narzucania z góry ich struktury. Interpretacja wyników została przeprowadzona z wykorzystaniem narzędzi Explainable Artificial Intelligence (XAI), w szczególności miar ważności zmiennych oraz zależności częściowych (partial dependence). Pozwoliło to na identyfikację zarówno ogólnych wzorców, jak i zróżnicowanych efektów dla różnych typów firm, a także na rozróżnienie znaczenia czynników absolutnych i relatywnych w kontekście lokalizacji. .
Wyniki
Wyniki wskazują, że choć absolutne czynniki lokalizacyjne, takie jak dostępność infrastruktury, mają istotne znaczenie dla wzrostu startupów, to kluczową rolę odgrywają czynniki relatywne, związane z charakterystyką sąsiedztwa i lokalnymi efektami aglomeracji. Jednocześnie efekty te nie są jednorodne – ich siła i kierunek zależą od cech początkowych firm. Zaobserwowano istotną heterogeniczność efektów przestrzennych: niektóre startupy korzystają z lokalizacji w ścisłym centrum ośrodków aglomeracyjnych, podczas gdy inne osiągają lepsze wyniki w mniej konkurencyjnych obszarach. Wyniki podważają podejście oparte na efektach średnich i wskazują na konieczność uwzględniania interakcji między firmą a jej otoczeniem.
Wnioski
Badanie wnosi wkład do literatury poprzez integrację podejścia opartego na cechach firm i analizie przestrzennej w ramach jednego modelu empirycznego. Pokazuje, że efekty lokalizacji są silnie zróżnicowane i zależne od kontekstu, co ma istotne implikacje dla polityki gospodarczej oraz doradztwa dla przedsiębiorców. Zamiast uniwersalnych rekomendacji lokalizacyjnych, wyniki sugerują potrzebę podejścia dopasowanego do profilu firmy. Metodologicznie praca pokazuje również potencjał narzędzi uczenia maszynowego i XAI w analizie złożonych zależności przestrzennych.
Słowa kluczowe:
startupy technologiczne: lokalizacja działalności gospodarczej: efekty aglomeracji: uczenie maszynowe: analiza przestrzenna
Pobierz prezentację (docx, 23 kB)Objective
The study aims to assess to what extent the growth of technological startups operating in Warsaw is driven by their initial characteristics (initial capital endowment and its structure, number of employees, etc.) and by intra-urban location-related factors, both absolute (e.g. infrastructure accessibility) and relative (neighbourhood composition and local context). It addresses whether the impact of location is uniform, or varies depending on the initial profile of the firm.
Methods
The analysis is based on data on technological startups located in Warsaw, combining information on their initial characteristics (e.g. employee number, size, capital structure, initial financial resources and endowments) with detailed spatial indicators relating to their intra-urban location (here, both absolute and relative factors are considered, describing the neighbourhood environment, and absolute distance to the main city`s amenities). To reduce dimensionality and identify key components describing the spatial environment, Principal Component Analysis (PCA) is applied. Next, tree-based machine learning models (XGBoost) are used to capture non-linear relationships and interactions between variables. In contrast to standard econometric approaches, this framework allows for the identification of heterogeneous effects without imposing a predefined functional form. To support interpretation, Explainable Artificial Intelligence (XAI) tools are employed, including variable importance measures and partial dependence analysis. This enables the identification of both general patterns and differentiated effects across firm types, and allows to distinguish the role of absolute versus relative location factors in shaping startup growth.
Results
The results indicate that while absolute location factors, such as access to infrastructure and the main city`s amenities, are relevant for startup growth, relative factors linked to neighbourhood characteristics and local agglomeration play a more decisive role. At the same time, these effects are not uniform. A substantial degree of heterogeneity is observed: some startups benefit from being located in dense, competitive environments, while others perform better in less saturated areas. This suggests that the impact of spatial context depends strongly on initial firm characteristics and challenges approaches based on average effects.
Conclusions
The study contributes by integrating firm-level and intra-urban spatial perspectives within a single empirical framework and by explicitly addressing heterogeneity in location effects. The findings have implications for both policy and practice, suggesting that location strategies should be tailored to firm-specific profiles rather than based on general rules. From a methodological perspective, the study demonstrates the usefulness of machine learning and XAI tools in analysing complex spatial relationships and uncovering non-linear and context-dependent effects.
Keywords
technological startups, business location, agglomeration effects, machine learning, spatial analysis
-
Cel
Dynamiczne przemiany procesów migracyjnych w Polsce są jednym z najistotniejszych zjawisk demograficznych, społecznych i ekonomicznych ostatnich dwóch dekad. Departament Statystyki Narodowego Banku Polskiego niemal od początku tych zmian prowadzi regularne badania służące pozyskiwaniu wiarygodnych danych opisujących te procesy. Głównym problemem jest brak dostępu do baz danych mogących stanowić operat losowania. Celem pracy jest przedstawienie wyzwań i stosowanych rozwiązań w celu zapewnienia możliwie rzetelnych informacji dla potrzeb polityki gospodarczej i statystyki bilansu płatniczego.
Metody
W ciągu ostatnich 20 lat Departament Statystyki NBP wielokrotnie realizował badania ankietowe Polaków za granicą, imigrantów z Ukrainy oraz imigrantów z Białorusi w Polsce. Upływ czasu oraz zmieniający się kontekst migracyjny uzasadniają potrzebę retrospektywnej analizy doświadczeń związanych z organizacją badań, stosowaną metodologią oraz sposobami upowszechniania wyników. Badania migracyjne prowadzone przez NBP łączy szereg wyzwań metodologicznych, w tym zapotrzebowanie na wrażliwe informacje dotyczące rynku pracy, wynagrodzeń i przekazów pieniężnych, a także brak operatu losowania i trudności w dotarciu do respondentów. Jednocześnie różnią się one pod względem miejsca realizacji (Polska i zagranica), języka badania oraz kontekstu migracyjnego (migracja ekonomiczna, uchodźcy, osoby uciekające przed represjami politycznymi). Wśród realizowanych projektów można wymienić badania Polaków za granicą prowadzone w latach 2007–2022 (najpierw metodą PAPI, następnie CAPI z doborem kwotowym), pilotażowe badania CAWI wśród Polaków w Niemczech w 2024 roku oraz badania gospodarstw domowych otrzymujących przekazy pieniężne w Polsce w latach 2024–2025. Badania imigrantów początkowo realizowano metodą Respondent Driven Sampling (RDS), a od 2019 roku prowadzone są ogólnopolskie badania metodą PAPI. W celu ograniczenia obciążeń wyniki ważone są z wykorzystaniem danych rejestrowych (np. PESEL-UKR, dane UdSC).
Wyniki
Kompilacja danych do statystyki bilansu płatniczego wymaga wykorzystania możliwie najbardziej wiarygodnych informacji. Badania oparte na próbach nielosowych wymagają spełnienia kilku warunków: możliwości synchronizacji z danymi rejestrowymi w celu ważenia wyników i ograniczania obciążeń (lub zastosowania specjalistycznych metod, takich jak RDS), realizacji dużych i zróżnicowanych prób oraz współpracy z instytucjami ułatwiającymi dotarcie do respondentów. Istotne znaczenie ma dostęp do rejestrów oraz świadomość ich ograniczeń. Kluczową rolę odgrywają także instytucje publiczne i prywatne wspierające kontakt z migrantami, a ich zaangażowanie wzmacniane jest poprzez upowszechnianie wyników badań.
Wnioski
Zmieniająca się sytuacja migracyjna, pandemia oraz rozwój badań internetowych pokazują, że podejście do badań migracyjnych musi ewoluować i dostosowywać się do nowych warunków. Jednocześnie konieczne jest zachowanie spójności danych i porównywalności wyników w czasie. Zmiany wprowadzane przez Narodowy Bank Polski obejmowały m.in. terminy badań, narzędzia, metody rekrutacji respondentów oraz zakres tematyczny. Kluczowym elementem wdrażania nowych rozwiązań była faza pilotażowa, pozwalająca ocenić jakość danych i dopracować założenia badawcze. Obecna stabilizacja procesów migracyjnych stwarza warunki do podjęcia prób budowy operatu losowania opartego na dostępnych rejestrach.
Słowa kluczowe:
migracje: CAPI: PAPI: CAWI: upowszechnianie wyników
Pobierz prezentację (docx, 18 kB)Objective
Dynamic changes in migration processes in Poland have been among the most important demographic, social and economic developments of the past two decades. The Statistics Department of Narodowy Bank Polski has conducted regular surveys since the early stages of these transformations to provide reliable data describing these processes. A key challenge is the lack of sampling frames. The aim of the paper is to present the main challenges and methodological solutions applied to ensure reliable information for economic policy and balance of payments statistics.
Methods
Over the past 20 years, the Statistics Department of Narodowy Bank Polski has repeatedly conducted surveys among Poles living abroad, Ukrainian immigrants in Poland, and Belarusian immigrants in Poland. The passage of time and the evolving migration context justify a retrospective analysis of experiences related to survey organisation, methodological approaches, and dissemination of results. Migration surveys conducted by NBP share several methodological challenges, including the need to collect sensitive information on labour market status, earnings and remittances, as well as the absence of a sampling frame and difficulties in reaching respondents. At the same time, they differ in terms of survey location (Poland and abroad), language, and migration context (economic migrants, refugees, politically displaced persons). Examples include surveys of Poles abroad conducted between 2007 and 2022 (initially using PAPI, later CAPI with quota sampling), a pilot CAWI survey among Poles in Germany in 2024, and surveys of households receiving remittances in Poland in 2024–2025. Immigrant surveys were initially conducted using Respondent Driven Sampling (RDS), while since 2019 nationwide surveys have been conducted using PAPI. To reduce bias, survey results are weighted using available administrative registers (e.g. PESEL-UKR, Office for Foreigners data).
Results
The compilation of balance of payments statistics requires the use of the most reliable data possible. Surveys based on non-probability samples require several conditions to be met: the possibility of aligning results with administrative data for weighting and bias reduction (or the use of specialised methods such as RDS), relatively large and diverse samples, and cooperation with institutions facilitating access to hard-to-reach populations. Access to administrative registers and awareness of their limitations are crucial. Public and private institutions that interact with migrants also play an important role, and maintaining cooperation with them is essential for effective data collection.
Conclusions
Changing migration dynamics, the COVID-19 pandemic and the expansion of online surveys demonstrate that migration research must evolve and adapt to new conditions. At the same time, maintaining data consistency and comparability over time remains essential. Changes introduced by Narodowy Bank Polski have included adjustments in survey timing, tools, recruitment strategies and research scope. Pilot studies have been a key component in implementing these changes. The current stabilisation of migration processes creates an opportunity to explore the development of sampling frames based on administrative data sources.
Keywords
migration: CAPI: PAPI: CAWI: dissemination of results
Cel
Problem badawczy ma dwojaki charakter - merytoryczny i metodologiczny. W pierwszym, wiodącym jest pytanie o wzory ścieżek rozwojowych gmin (trajektorii), definiowanych w terminach redukcji wielowymiarowego indeksu deprywacji lokalnej WIDL, za okres 2004-2016 z koncentracją na wybranych aspektach zróżnicowań miedzy częściami, wg umownego podziału, za Eurostatem, woj. mazowieckiego na `stołeczne` i `region`. Obiektem drugiego są wyznaczniki tych zróżnicowań w czaso-przestrzennym ujęciu `diachronicznym`, dzięki przedstawieniu odnośnych zmiennych w wersji Danych Funkcjonalnych, FD.
Metody
: Identyfikacja determinant zróżnicowań pomiędzy wzorami rozwoju lokalnego, gmin, włącza metody analizy przestrzennej (na danych BDL) - w tym autokorelacji FD-wersji wskaźnika WIDL, wg dziedzin deprywacji / rozwoju (`FD-klastry`). Zaś ewaluacja wpływu środków rozwojowych (`subwencji` dla gmin na osobę) dokonana jest najpierw z punktu widzenia `sprawiedliwości przestrzennej` (opisowo, przez porównanie z dystrybucją symulowaną za pomocą funkcji rozdziału środków “wg zapotrzebowania na rozwój”), a następnie ‘parametrycznie’ za pomocą brzegowej analizy korzyści (Marginal Benefit Incidence Analysis (MBIA), dla zweryfikowania hipotezy o efektywnej polityce ich ‘targetyzacji’ . Nadto, pytanie o to, czy polityka ta wykazuje jakąś tendencję - w sensie przestrzennego współwystępowania (skupień) gmin o podobnym odchyleniu subwencji rzeczywistych od oczekiwanych (na gruncie wspomnianej zasady ‘sprawiedliwości’) jest przedmiotem wizualizacji dla wybranych lat: 2004-08-10-12-16. Znaczenie innych czynników wpływu, oprócz subwencji, w tym wybranych charakterystyk gmin oraz zmiennych pochodzących z badan gospodarstw domowych (uczestniczących w SILC_UE mieszkańców niektórych gmin), jak dochód i wykształcenie głowy g. dom., jest szacowany w modelu (wielomianowej) regresji logistycznej w sposób porównawczy - dla gmin o generalnie `rosnącym` vs. ‘malejącym’ wzorze zmian w czasie (trajektorii rozwoju gminy).
Wyniki
Stosunkowo najbardziej odmienne okazały się wzory zmian, trajektorie (`rozwój rosnący` i `malejący`) między częściami woj. mazowieckiego. Wprawdzie subwencje generalnie trafiają do gmin `najbardziej potrzebujących` (wg wskaźnika WIDL), co potwierdza też analiza MBIA, ale wyłaniający się wzór ’konwergencji’, cechujący się tendencją do zmniejszaniu się nierówności przestrzennych, dominuje wśród gmin najmniej rozwiniętych (równanie `w dół`, zamiast `w górę`). Profile oddziaływania czynników różnią się bardziej miedzy gminami cechującymi się przeważająco rosnącym vs. malejącym wzorcem rozwoju niż miedzy gminami obydwu części województwa - poza sprzyjającym wzrostowi saldem migracji wewnętrznej (w woj. ‘stołecznym’) oraz frakcji osób w wieku produkcyjnym wśród gmin o rozwoju malejącym.
Wnioski
Pomijając ograniczenia informacji zawartych w Banku Danych Lokalnych, pozwalają one na korzystania z wielu oferowanych w literaturze narzędzi oceny procesów rozwojowych. Zarówno na szczeblu planowanych dystrybucji środków rozwojowych (możliwe jest oszacowanie obiektywnego `zapotrzebowania na rozwój, ex ante), jak i ewaluacji z punktu widzenia `słuszności przestrzennej` i efektywności zastosowanego schematu ich alokacji (ex post). Przyjęcie perspektywy ‘diachronicznej’ (dzięki FD-wersji zmiennych) pozwoliło na identyfikację ‘wkładu’ każdej z 11-tu dziedzin deprywacji do specyficznej dla każdego województwa trajektorii rozwoju gmin
Słowa kluczowe:
wzory rozwoju lokalnego - pomiar deprywacji lokalnej - brzegowa analiza korzyści / MBIA - analiza przestrzenna - zastosowanie Danych Funkcjonalnych
Pobierz prezentację (pdf, 405 kB)Objective
The research problem is twofold – substantive and methodological. The first question focuses on patterns in gminas` development paths (trajectories), defined in terms of reductions In the multidimensional index of local deprivation (WIDL), from 2004 to 2016, with particular emphasis on differentiation between parts of the Mazowieckie Voivodeship, distinguished conventionally, after Eurostat, into ”capital” and ”region.” The second question concerns the determinants of these differentiations in a ”diachronic” spatio-temporal approach, by presenting relevant variables in Functional Data version.
Methods
Identification of determinants of variation between local development patterns / municipalities involves spatial analysis methods (using BDL data)—including autocorrelation of the FD version of the WIDL index, by deprivation / development domains (`FD-clusters`). The impact of development funds (`subsidies` for municipalities per person) is evaluated first from the perspective of `spatial equity` (descriptively, by comparison with the distribution simulated using the `development needs` function), and then `parametrically` using Marginal Benefit Incidence Analysis (MBIA) to verify the hypothesis about an effective `targeting` policy. Moreover, the question of whether this policy shows any tendency - in the sense of spatial co-occurrence (clusters) of municipalities with a similar deviation of actual subsidies from expected ones (based on the aforementioned `equity` principle) is the subject of visualization for selected years: 2004-08-10-12-16. The importance of other influencing factors, apart from subsidies, including selected characteristics of municipalities and variables derived from household surveys (residents of some municipalities participating in SILC_UE), such as income and education of the household head, is estimated in a (multinomial) logistic regression model in a comparative manner - for municipalities with a generally `increasing` vs. `decreasing` pattern of changes over time (municipal development trajectory).
Results
The patterns of change (”increasing ” and ”decreasing” trajectories) for parts of the Mazovian proved to be relatively most different. While subsidies generally go to the ”needy” gminas, also confirmed by the MBIA results, the emerging ”convergence” pattern is characterized by a tendency toward decreasing spatial inequalities, which dominates among the least developed gminas (a ”downward” rather than ”upward” equation). The profiles of factor impacts differ more between gminas characterized by a predominantly increasing vs. decreasing development pattern than between municipalities in both parts of the voivodeship – apart from the growth-friendly internal migration balance (in the `capital` voivodeship) the fraction of the working-age people among the gminas with dwit declining pattern.
Conclusions
Despite the limitations of the information contained in the Local Data Bank, they allow for the use of numerous analytical tools offered in the literature for assessing development processes. Both at the level of planned distribution of development funds (it is possible to estimate the objective ”development demand” ex ante) and evaluation from the perspective of ”spatial equity” and the effectiveness of the applied allocation scheme (ex post). Adopting a ”diachronic” perspective (thanks to the FD-version of variables) allowed for the identification of the ”contribution” of each of the 11 deprivation domains to the municipal development trajectory specific to each voivodeship.
Keywords
Local development patterns - local deprivation measurement - Marginal Benefit Incidence Analysis / MBIA - spatial analysis - Functional Data application.
Cel
Braki danych stanowią istotne wyzwanie w analizach statystycznych, zwłaszcza w badaniach o silnej sezonowości, takich jak badanie wykorzystania turystycznej bazy noclegowej w Polsce. Celem pracy jest ocena skuteczności wybranych metod uczenia maszynowego w imputacji danych dla jednostek, które nie przekazały sprawozdań, w szczególności w zakresie liczby turystów oraz liczby udzielonych noclegów. Sformułowano pytanie badawcze, czy metody oparte na uczeniu maszynowym umożliwiają uzyskanie wyższej dokładności estymacji niż podejścia klasyczne, w szczególności w warunkach silnej sezonowości.
Metody
W badaniu wykorzystano dane pochodzące z comiesięcznego sprawozdania KT-1, dotyczącego wykorzystania turystycznej bazy noclegowej w Polsce. Analizie poddano zmienne opisujące liczbę turystów oraz liczbę udzielonych noclegów, a także zestaw cech pomocniczych odnoszących się do wymiaru czasowego i przestrzennego, takich jak miesiąc obserwacji, położenie obiektu czy charakter regionu. Przed etapem modelowania przeprowadzono proces inżynierii cech, obejmujący konstrukcję zmiennych sezonowych, agregatów czasowych, komponentu trendu oraz miar zależności przestrzennych. Uwzględniono również przekształcenia zmiennych oraz selekcję cech istotnych z punktu widzenia modelowania. Dane zostały następnie oczyszczone, poddane kontroli jakości oraz odpowiednio przygotowane do zastosowania metod uczenia maszynowego. W dalszej części analizy rozpatrzono dwa horyzonty czasowe dostępności danych: t+10 (10 dni po zakończeniu miesiąca sprawozdawczego) oraz t+20 (20 dni po jego zakończeniu). Braki danych występujące w tych okresach imputowano z wykorzystaniem wybranych algorytmów uczenia maszynowego. Uzyskane wyniki porównano z danymi ostatecznymi w celu oceny możliwości wiarygodnego oszacowania liczby turystów i udzielonych noclegów na wcześniejszym etapie, tj. przed upływem standardowych 42 dni od zakończenia okresu sprawozdawczego.
Wyniki
Uzyskane wyniki wskazują, że wszystkie analizowane metody osiągają satysfakcjonujące rezultaty, jednak ich skuteczność jest zróżnicowana w zależności od miesiąca oraz charakteru analizowanej zmiennej. Zaobserwowano, że dokładność imputacji zmienia się w ciągu roku, co jest związane z występowaniem wyraźnych wzorców sezonowych w danych dotyczących ruchu turystycznego. Najwyższą jakość imputacji uzyskano dla modeli uwzględniających nieliniowe zależności między zmiennymi oraz ich wzajemne interakcje, co pozwala lepiej odwzorować złożoną strukturę analizowanych zjawisk. Jednocześnie wykazano, że sezonowość danych stanowi istotny czynnik wpływający na efektywność zastosowanych metod, determinując zarówno poziom błędów imputacji, jak i stabilność uzyskiwanych wyników w różnych okresach.
Wnioski
Przeprowadzone badanie potwierdza, że metody uczenia maszynowego mogą poprawiać jakość imputacji danych w badaniu KT-1. Najwyższą skuteczność wykazały algorytmy zdolne do modelowania nieliniowości oraz współzależności między zmiennymi. Uzyskane wyniki wskazują, że podejście oparte na inżynierii cech i modelach ML może być z powodzeniem wykorzystywane w statystyce publicznej, wspierając bieżące uzupełnianie braków danych oraz zwiększając wiarygodność analiz dotyczących wykorzystania bazy noclegowej w Polsce.
Słowa kluczowe:
imputacja danych, baza noclegowa, uczenie maszynowe
Pobierz prezentację (docx, 21 kB)Objective
Missing data constitute a significant challenge in statistical analyses, particularly in studies characterized by strong seasonality, such as the survey on the use of tourist accommodation establishments in Poland. This study aims to assess the effectiveness of selected machine learning methods in imputing missing data for units that did not submit reports, especially regarding the number of tourists and overnight stays. The analysis examines whether ML-based approaches provide more accurate estimates than traditional methods under seasonal variability.
Methods
The study used data obtained from the monthly KT-1 report on the use of tourist accommodation establishments in Poland. The analysis covered variables describing the number of tourists and the number of overnight stays, as well as a set of auxiliary features related to temporal and spatial dimensions, such as the month of observation, the location of the establishment, and the characteristics of the region. Prior to the modeling stage, a feature engineering process was conducted, including the construction of seasonal variables, time aggregates, trend components, and measures capturing spatial dependencies. Transformations of variables and the selection of features relevant from a modeling perspective were also applied. The data were subsequently cleaned, subjected to quality control, and appropriately prepared for the application of machine learning methods. In the next stage of the analysis, two data availability horizons were considered: t+10 (10 days after the end of the reporting month) and t+20 (20 days after its completion). Missing data observed at these time points were imputed using selected machine learning algorithms. The obtained results were then compared with the final data in order to assess the possibility of reliably estimating the number of tourists and overnight stays at an earlier stage, i.e. before the standard 42-day period following the end of the reporting period.
Results
The results indicate that all analyzed methods achieve satisfactory performance: however, their effectiveness varies depending on the month and the type of variable considered. It was observed that imputation accuracy changes over the course of the year, reflecting strong seasonal patterns in tourism data. The best results were obtained for models that capture nonlinear relationships and interactions between variables, enabling a more accurate representation of complex data structures. Seasonality was also identified as a key factor influencing performance, affecting both imputation errors and the stability of results across different periods.
Conclusions
The conducted study confirms that machine learning methods can improve the quality of data imputation in the KT-1 survey. The highest performance was achieved by algorithms capable of modeling nonlinear relationships and interdependencies between variables. The results indicate that an approach based on feature engineering and ML models can be successfully applied in official statistics, supporting the timely completion of missing data and enhancing the reliability of analyses related to the use of tourist accommodation establishments in Poland.
Keywords
data imputation, tourist accommodation establishments, machine learning
Cel
Listy zapowiednie są nieodzownym elementem metodologii badań ankietowych. Badania pokazują, że listy zapowiednie mają wpływ na wskaźniki odpowiedzi oraz jakość danych (np. Link i Mokdad 2005, De Leeuw i in. 2007, Lynn 2016). Mogą one również mieć większy wpływ na udział osób starszych w badaniach (np. Vogl 2018, Link i Mokdad 2005). W Badaniu Zdrowia, Starzenia się Populacji i Procesów Emerytalnych (ang. Survey of Health, Ageing and Retirement in Europe, SHARE) przeprowadzono eksperyment metodologiczny mający na celu ocenę skuteczności różnych wersji listów zapowiednich.
Metody
Eksperyment przeprowadzono w 2025 r. w ramach zbierania danych 10. fali badania SHARE, jako część procedury odświeżania próby w Polsce. Grupą docelową badania SHARE są osoby w wieku powyżej 50 lat. Wylosowano 2832 osoby w wieku od 50 do 97 lat i którym przypisano losowo jedną z czterech wersji listu zapowiedniego, stanowiącego standardowy pierwszy kontakt z osobami nowo zaproszonymi do udziału w badaniu SHARE. Wersje listów zostały celowo utrzymane w podobnym stylu, ale różniły się zawartością dwóch rodzajów informacji: graficznego przedstawienia wyników poprzednich badań oraz krótkiego akapitu na temat zachęty finansowej przyznawanej respondentom za udział w badaniu. Ponieważ operatem losowania próby w badaniu SHARE jest rejestr PESEL, to znane są informacje dotyczące wieku, płci i adresu (np. wielkość miejscowości, województwa) potencjalnych respondentów. W analizie skupiamy się na ocenie związku między różnymi wersjami listów a prawdopodobieństwem udziału w badaniu. Szacujemy modele logistyczne zmiennej dwumianowej, aby modelować prawdopodobieństwo udziału w badaniu jako funkcję wersji listu, płci, wieku i cech miejsca zamieszkania. W momencie, kiedy udostępniony zostanie pełny zbiór danych z fali 10 SHARE, planujemy rozszerzyć naszą analizę o weryfikację, czy rodzaj listu jest powiązany z wybranymi wskaźnikami jakości odpowiedzi.
Wyniki
Najskuteczniejszą wersją listu pod względem wskaźnika odpowiedzi okazała się wersja „kompletna”, zawierająca oba rodzaje informacji – zarówno wizualną prezentację wyników poprzednich badań SHARE (dotyczących tego, czy ludzie chcą przejść na emeryturę jak najszybciej, czy też wolą pracować dłużej), jak i informację o zachęcie finansowej. Różnice we wskaźnikach odpowiedzi między czterema rodzajami listów były niewielkie: około czterech punktów procentowych między wersjami z największym i najmniejszym wskaźnikiem odpowiedzi. Uwzględniając jednak całkowite koszty badania oraz obserwowane ostatnio problemy z niechęcią do badań ankietowych, są tu różnice, których nie można zignorować.
Wnioski
Na podstawie wyników eksperymentu metodologicznego można sformułować pewne zalecenia dotyczące listów zapowiednich skierowanych do osób w wieku powyżej 50 lat. Staranne i przemyślane przygotowanie takiego listu może przyczynić się do zauważalnego wzrostu wskaźników odpowiedzi, jednak wyniki naszego eksperymentu wskazują, że z pewnością nie jest to jedyny aspekt badania, który może sprawić, że wskaźniki odpowiedzi osiągną poziomy obserwowane w przeszłości. Osiągnięcie wysokiego wskaźnika odpowiedzi w badaniach społecznych wymaga rozważnego planowania także innych aspektów metodologii badania, w tym starannego przygotowania narzędzia badawczego, a także profesjonalizmu ankietera.
Słowa kluczowe:
listy zapowiednie, eksperyment metodologiczny, SHARE, wskaźniki odpowiedzi
Pobierz prezentację (pdf, 65 kB)Objective
Advance letters are an indispensable part of survey methodology. Studies have shown that advance letters impact response rates and data quality (e.g. Link and Mokdad 2005, De Leeuw et al. 2007, Lynn 2016). They may also have a greater effect on the participation of older adults in surveys (e.g. Vogl 2018, Link and Mokdad 2005). We present the results of a recent survey experiment conducted in the Survey of Health, Ageing and Retirement in Europe (SHARE).
Methods
The experiment was conducted within wave 10 fieldwork, as part of the sample refreshment procedure in Poland in the 2025. The SHARE target population is people aged 50+. The 2832 sampled individuals aged 50-97 years were randomly assigned to one of the four versions of an advance letter, which is a standard first point of contact with persons newly invited to participate in the SHARE survey. The versions of the letters were intentionally kept similar but differed in their inclusion of two types of information: a graphical depiction of previous survey findings and a brief paragraph about the monetary incentive granted to respondents for participating. Since the sampling frame for SHARE survey is the PESEL register, the information on age, sex and address (for example, size of locality, region) of the potential respondents is known. In the analysis, we concentrate on the relation of different version of letters with the probability of survey participation. We estimate binary logistic models to model the probability of survey participation as a function of letter version, sex, age and place of living characteristics. When full Wave 10 dataset is available, we plan to extend our analysis to verify whether the type of the letter is linked to some survey quality characteristics.
Results
The most successful version of the letter in terms of the response rate was the ‘complete’ version, which included both types of information – the visual presentation of previous SHARE findings (whether people want to retire as soon as possible or prefer to work longer) and the information on monetary incentive. The differences in response rates across the four types of letters were modest: around four percentage points between the most and the least successful versions. However, these differences cannot be ignored when considering overall survey costs and the recent problems with survey reluctancy as well as struggling to reach a reasonable response rates.
Conclusions
Our findings provide some recommendations for the overall design of advance letters targeted at the population aged 50+. Certainly, a careful preparation of the advance letter may bring a non-ignorable increase in response rates, but the results of our experiment show that this is certainly not the single survey aspect that may bring response rates to the levels observed in the past. Achieving high response rates in social surveys requires careful consideration of other aspects of survey methodology, including the professionalism, positive motivation and decent employment conditions of the interviewers.
Keywords
advance letters, survey experiment, response rate, SHARE
Cel
Celem badania jest analiza różnic w sposobie budowy reprezentanta oraz metod obliczania wskaźnika cen ofert turystycznych. Porównanie dotyczy danych uzyskanych z badania ankieterskiego bazującego na 207 rejonach ankieterskich w ramach badania cen towarów i usług konsumpcyjnych oraz danych uzyskanych od gestorów. Problem badawczy dotyczy odpowiedzi na pytanie: W jaki sposób dane z alternatywnych źródeł mogą stanowić bazę do uzyskania porównywalnych jakościowo wskaźników cen turystyki do analizy ich dynamiki ?
Metody
Dane źródłowe pochodzą z badań statystyki publicznej oraz od gestorów danych. W przypadku danych pochodzących z zasobów statystyki publicznej, są one zebrane z 207 rejonów ankieterskich. Ustalenie listy reprezentantów do badania odbywa się przede wszystkim metodą doboru celowego w oparciu o Klasyfikację Spożycia Indywidualnego według Celu COICOP, z uwzględnieniem wyników badania budżetów gospodarstw domowych. Dobór drugiego źródła danych ma charakter celowy, a wybór jednostek do próby został oparty o dostępność danych. Analiza porównawcza danych ofertowych i danych transakcyjnych oparta jest o różnice w zdefiniowaniu reprezentanta do przedmiotowego badania. Dane transakcyjne charakteryzują się niejednolitymi charakterystykami informacji o produktach / ofertach uzyskiwanych od gestorów. Cechy charakteryzujące poszczególne oferty różnią się liczbą kategorii i specyfikacją. Duża zmienność oferty produktowej w czasie wynika z charakteru danych, które cechuje sezonowość występowania w okresie jednego roku. Ponadto dane transakcyjne zawierają dużo więcej informacji oraz możliwości budowy reprezentanta w porównaniu do danych ankieterskich. Przy zastosowaniu nieparametrycznych testów statystycznych dokonano oceny różnicowania w sposób statystycznie istotny podziału na kategorie w ramach danych cech dla opisu reprezentanta. Jest to punkt wyjścia do analiz w celu obliczenia i porównania wskaźników cen dla turystyki.
Wyniki
Wyniki przeprowadzonej analizy dwóch źródeł danych w kontekście ich wykorzystania do obliczenia wskaźników cen dla turystyki wskazują na potrzebę zdefiniowania cech reprezentanta w oparciu o metody wnioskowania statystycznego. Dokonana analiza statystyczna pozwoliła na wskazanie potencjalnych reprezentantów do wyliczenia wskaźnika cen na podstawie alternatywnych źródeł danych i obliczenia wskaźnika cen na tej podstawie. Wyniki obliczeń wskaźnika cen usług turystycznych w oparciu o dane ofertowe (pochodzące ze statystyki publicznej) oraz dane transakcyjne (alternatywne źródło danych – od gestorów) wykazują zbieżność uzyskiwanych wartości wskaźników cen.
Wnioski
Przeprowadzona analiza dwóch źródeł danych wskazała na możliwość wykorzystania danych transakcyjnych od gestorów jako alternatywnego źródła danych w stosunku do danych ankieterskich, mających charakter danych ofertowych. Potencjalnie może być to podstawą do zwiększenia wolumenu danych na podstawie których obliczany jest wskaźnik cen dla turystyki. Z należytą starannością powinno się konstruować reprezentanta dla danych transakcyjnych. Ten etap badania winien być oparty o testy statystyczne, bo są one gwarantem i wiarygodnym narzędziem opisu podstawowego elementu każdego badania w statystyce publicznej.
Słowa kluczowe:
Reprezentant w badaniu cen, wskaźnik cen, źródło danych, wolumen danych
Pobierz prezentację (docx, 22 kB)Objective
The aim of the study is to analyze differences in the construction of the representative and the methods for calculating the tourism price index. The comparison involves data obtained from a survey based on 207 survey regions as part of the Consumer Price Survey and data obtained from data providers. The research problem addresses the question: How can alternative data sources serve as a basis for obtaining qualitatively comparable tourism price indices for analyzing their dynamics?
Methods
The source data comes from public statistics surveys and from data providers. In the case of data from public statistics resources, it is collected from 207 survey regions. The list of representatives for the study is determined primarily by purposive sampling based on the Classification of Individual Consumption according to the Purpose of the COICOP, taking the results of the household budget survey into account. The selection of the second data source is purposive, and the selection of sample units was based on data availability. The comparative analysis of offer data and transaction data is based on differences in the definition of a representative for this study. Transaction data is characterized by inconsistent characteristics in the information about products / offers obtained from providers. The features characterizing individual offers differ in the number of categories and specifications. The significant variability of the product offering over time results from the nature of the data, which is characterized by seasonality within a single year. Furthermore, transaction data contain much more information and opportunities to construct a representative compared to survey data. Using nonparametric statistical tests, statistically significant differentiation was assessed for the division into categories within the given characteristics for the representative description. This serves as a starting point for analyses to calculate and compare price indices for tourism.
Results
The results of the analysis of two data sources in the context of their use in calculating price indices for tourism indicate the need to define representative characteristics based on statistical inference methods. The statistical analysis performed allowed for the identification of potential representatives for the calculation of the price index based on alternative data sources and the calculation of the price index on this basis. The results of the calculations of the tourism services price index based on offer data (sourced from public statistics) and transaction data (an alternative data source from operators) demonstrate convergence in the obtained price index values.
Conclusions
The analysis of two data sources indicated the possibility of using transaction data from operators as an alternative to survey data, which are typically offer-based. This could potentially provide a basis for increasing the amount of data used to calculate the tourism price index. Due care should be taken in constructing a representative for transaction data. This stage of the study is to be based on statistical tests, as they provide a reliable basis for describing the fundamental element of any official statistics study.
Keywords
Representative in price survey, price index, data source, data volume
Cel
Celem badania było oszacowanie wpływu rozbieżności między definicją lasów stosowaną w Polsce a zharmonizowaną definicją określoną w Rozporządzeniu (UE) nr 691 / 2011 na różnicę pomiędzy powierzchnią lasów wykazywaną przez Polskę w Europejskich Rachunkach Leśnych oraz w statystyce krajowej. Kluczowe różnice w stosowanej definicji lasu to minimalny próg powierzchni kompleksów leśnych wynoszący w Polsce 0,1 ha (w porównaniu do 0,5 ha w rozporządzeniu EEA) oraz kryterium pokrycia koronami drzew, które jest ujęte w definicji rozporządzenia EEA.
Metody
Kluczowe różnice w stosowanej definicji lasu to minimalny próg powierzchni kompleksów leśnych wynoszący w Polsce 0,1 ha (w porównaniu do 0,5 ha w rozporządzeniu EEA) oraz kryterium pokrycia koronami drzew, które jest ujęte w definicji rozporządzenia EEA, a które nie występuje w krajowej definicji lasu. Harmonizacja definicyjna przekładająca się na raportowane wielkości jest potrzebna dla zapewnienia porównywalności statystyk środowiskowo-ekonomicznych między państwami członkowskimi UE. Korzystając z danych źródłowych Wielkoobszarowej Inwentaryzacji Stanu Lasów (WISL) z lat 2022–2023, w ramach badania zidentyfikowano powierzchnie próbne położone w małych kompleksach leśnych (0,1–0,5 ha) oraz na powierzchnie położone na obszarach wykazywanych jako las w Ewidencji Gruntów i Budynków, ale w rzeczywistości wykorzystywane do celów nieleśnych. Weryfikację przeprowadzono porównując dane WISL z innymi źródłami mapowymi. Na podstawie liczby zidentyfikowanych powierzchni próbnych spełniających te dwa kryteria oszacowano ogólną powierzchnię gruntów leśnych, o którą należało przeprowadzić korektę powierzchni lasów według definicji krajowej, w celu zapewnienia zgodności z definicją wynikającą z rozporządzenia.
Wyniki
Oszacowana w badaniu powierzchnia gruntów leśnych położonych w kompleksach leśnych o powierzchni 0,1–0,5 ha była niewielka w stosunku do łącznej powierzchni lasów ustalonej według definicji krajowej (poniżej 1% w latach 2022-2023). Różnica ta była zróżnicowana w zależności od formy własności, większa w rozdrobnionych lasach prywatnych i własności rolnej Skarbu Państwa (-3,2% w 2023 r.) oraz w przypadku lasów prywatnych (-2,8% w 2023 r.). Wiąże się to ze specyfiką tych form własności — lasy te są bardziej rozproszone, a w większości przypadków podmioty nimi zarządzające nie prowadzą profesjonalnej gospodarki leśnej. Różnica była marginalna w lasach państwowych.
Wnioski
Wpływ różnicy w definicji lasu w Polsce w stosunku do definicji przyjętej na potrzeby rachunków leśnych jest niewielki. Mimo tego uznano, że wprowadzenie korekty z tego tytułu w powierzchni lasów podawanej w Europejskich Rachunkach Leśnych zwiększy spójność danych i porównywalność z innymi krajami UE. Wykorzystanie w tym celu oszacowanego w badaniu wskaźnika korekty pozwoli zachować równowagę między korzyściami w postaci spójności i porównywalności danych a pracochłonnością i kosztami ich opracowania.
Słowa kluczowe:
rachunki leśne, definicja lasu, lasy, leśnictwo
Pobierz prezentację (docx, 23 kB)Objective
The objective of the study was to examine the impact of discrepancies between the Polish (national) definition of a forest and the harmonised definition specified in the European Environmental Economic Accounts (EEA) Regulation (EU) 691 / 2011 on forest area reported in European Forest Accounts and in national statistics. Key differences include minimum forest area threshold of 0.1 ha in Poland (vs. 0.5 ha under EEA regulation) and the canopy cover criterion laid down in the EEA regulation and not specified in the national law.
Methods
Key differences in the definition of a forest between the national statistics and Environmental Economic Accounts Regulation include minimum forest area threshold of 0.1 ha in Poland (vs. minimum size of 0.5 ha under EEA regulation) and the canopy cover criterion laid down in the EEA regulation and not specified in the national law. Harmonisation of definitions that affects the reported figures is necessary to ensure the comparability of environmental and economic statistics across EU Member States. Using 2022–2023 National Forest Inventory source data, we identified and quantified National Forest Inventory sample plots located in small forest complexes (size of 0.1–0.5 ha) and areas that are listed as forests in the Land and Buildings Register but actually used for non-forest purposes. The verification was carried out by comparing source National Forest Inventory data with other map sources. Based on the number of identified sample plots meeting these two criteria, we estimated the adjustment of the total forest area needed to comply with the European Environmental Economic Accounts Regulation definition. This adjustment was also further broken down by the forms of forest ownership.
Results
In the years 2022–2023, the difference between the estimated forest area located in forest complexes of 0.1–0.5 ha and the total forest area specified according to the national definition was minor – less than 1%. Taking into consideration the form of ownership, the difference was greater in fragmented private forests and forests in the Agricultural Property Stock of the State Treasury (-3.2% in 2023) and for private forests (-2.8% in 2023). ). This is related to the specific nature of these forms of ownership — these forests are more scattered, and in most cases, the entities managing them do not conduct professional forest management. The adjustment was marginal in state forests.
Conclusions
The estimated impact of the difference between the domestic definition of a forest and the definition adopted for the purposes of European Forest Accounts is minimal. However, we decided that the adjustment to the forest area for the purposes of the European Forest Accounts will increase EU data consistency and comparability. The use of adjustment rate calculated in our study will allow to balance the benefits in terms of consistency and comparability of data with the effort and costs of their production.
Keywords
forest accounts, definition of a forest, forest, forestry
Cel
Celem referatu jest identyfikacja długookresowych trajektorii koncentracji przestrzennej aktywności innowacyjnej w 30 krajach Europy w latach 1980–2022 oraz ocena, czy zmiany te mają charakter trwałej konwergencji, utrzymującej się dywergencji, czy raczej nieliniowej dynamiki. Analiza odpowiada na pytanie, czy obserwowane rozpraszanie innowacji między regionami było procesem trwałym, czy jedynie przejściową fazą poprzedzającą ponowną koncentrację.
Metody
Badanie oparto na dwóch pełnych zbiorach danych o patentach, a nie na próbie statystycznej, dlatego nie stosowano procedur uogólniania wyników z próby na populację ani oceny błędów losowych typowej dla badań reprezentacyjnych. Pierwszy zbiór to globalna baza geolokalizowanych patentów de Rassenfosse, Kozak i Seliger (2019), obejmująca lata 1980–2014: po ograniczeniu do Europy wykorzystano 3 247 672 obserwacje z informacją o roku, regionie i dokładnej lokalizacji (x,y) wynalazcy. Drugi zbiór to OECD Regions and Cities Atlas dla lat 1995–2022, zawierający regionalnie zagregowane dane patentowe dla poziomów TL2 i TL3. Analizą objęto 30 krajów europejskich, z podziałem na Europę Zachodnią i Europę Środkowo-Wschodnią. Zastosowano dwa komplementarne mierniki koncentracji przestrzennej: współczynnik Giniego dla danych zagregowanych regionalnie oraz wskaźnik ETA (Entropy–Tessellation–Agglomeration) dla danych punktowych, oparty na teselacji Voronoi i entropii Shannona. W celu ograniczenia wpływu krótkookresowych wahań obliczenia prowadzono w pięcioletnich ruchomych oknach średnich. Podejście porównawcze pozwala uchwycić zarówno nierówności między regionami administracyjnymi, jak i koncentrację niezależną od granic jednostek terytorialnych, ograniczając problem MAUP. Dla średnich trajektorii zmian sprawdzono także dopasowanie funkcji kwadratowej, co pozwoliło formalnie zweryfikować nieliniowy, U-kształtny przebieg zmian koncentracji.
Wyniki
Wyniki wskazują U-kształtną trajektorię koncentracji przestrzennej patentów w Europie. W latach 1980-2010 aktywność innowacyjna stawała się coraz bardziej rozproszona, zaś później nastąpiła ponowna koncentracja. W krajach Europy Środkowo-Wschodniej spadek koncentracji był silniejszy niż kraje Europy Zachodniej, lecz stale pozostały bardziej skoncentrowane przestrzennie. Możliwym wyjaśnieniem tej sekwencji zmian jest przesunięcie akcentów polityki publicznej: wcześniejsza polityka kohezyjna sprzyjała bardziej szerokiej dyfuzji środków i stopniowemu rozpraszaniu aktywności innowacyjnej, podczas gdy późniejsza polityka doskonałości silniej koncentrowała wsparcie w ośrodkach już nasyconych innowacjami.
Wnioski
Przestrzenne wyrównywanie innowacyjności ma charakter przejściowy, a nie trwały. Polityka spójności może rozszerzać terytorialny zasięg innowacji, zwłaszcza w fazie dyfuzji i nadrabiania zapóźnień, ale nie eliminuje sił aglomeracyjnych związanych z innowacją na granicy technologicznej i nie niweluje efektów polityki doskonałości, która ponownie koncentruje finansowanie i aktywność badawczo-rozwojową w miejscach już silnie nasyconych innowacjami. Badanie pokazuje użyteczność łączenia danych punktowych i regionalnych, jak i klasycznych miar nierówności z miarami entropijnymi opartymi na danych geolokalizowanych.
Słowa kluczowe:
innowacje: patenty: koncentracja przestrzenna: nierówności regionalne: polityka innowacyjna
Pobierz prezentację (docx, 20 kB)Objective
The aim of this paper is to identify long-term trajectories of the spatial concentration of innovation activity in 30 European countries between 1980 and 2022, and to assess whether these changes reflect sustained convergence, persistent divergence, or rather nonlinear dynamics. The analysis addresses the question of whether the observed dispersion of innovation across regions was a permanent process or merely a temporary phase preceding a renewed concentration.
Methods
The study was based on two complete patent datasets rather than a statistical sample: therefore, no procedures were used to generalize results from the sample to the population or to assess random errors. The first dataset is the global geolocated patent database by Rassenfosse, Kozak, and Seliger (2019), covering the years 1980–2014: after restricting the data to Europe, 3,247,672 observations were used, each containing information on the year, region, and exact location (x,y) of the inventor. The second dataset is the OECD Regions and Cities Atlas for the years 1995–2022, containing regionally aggregated patent data for TL2 and TL3 levels. The analysis covered 30 European countries, divided into Western Europe and Central and Eastern Europe. Two complementary measures of spatial concentration were used: the Gini coefficient for regionally aggregated data and the ETA (Entropy–Tessellation–Agglomeration) index for point data, based on Voronoi tessellation and Shannon entropy. To limit the impact of short-term fluctuations, calculations were performed using five-year moving average windows. This comparative approach captures both inequalities between administrative regions and concentration independent of territorial unit boundaries, mitigating the MAUP problem. For the average trajectories of changes, a quadratic function fit was also tested, which allowed for the formal verification of the nonlinear, U-shaped pattern of concentration changes.
Results
The results indicate a U-shaped trajectory of spatial concentration of patents in Europe. Between 1980 and 2010, innovation activity became increasingly dispersed, followed by a subsequent re-concentration. In Central and Eastern European countries, the decline in concentration was more pronounced than in Western European countries, yet they remained more spatially concentrated. A possible explanation for this sequence of changes is a shift in the focus of public policy: earlier cohesion policy favored a broader diffusion of resources and a gradual dispersion of innovation activity, while later excellence policy concentrated support more strongly in centers already saturated with innovation.
Conclusions
The spatial equalization of innovation is temporary rather than permanent. Cohesion policy can expand the territorial reach of innovation, especially during the diffusion and catch-up phases, but it does not eliminate the agglomeration forces associated with innovation at the technological frontier, nor does it offset the effects of excellence policies, which once again concentrate funding and R*D activity in areas already heavily saturated with innovation. The study demonstrates the utility of combining point and regional data, as well as classical measures of inequality with entropy measures based on geolocated data.
Keywords
innovation: patents: spatial concentration: regional disparities: innovation policy
Cel
Celem referatu jest przedstawienie metody estymacji liczby rezydentów w Polsce na poziomie gmin z wykorzystaniem zintegrowanych rejestrów administracyjnych. Punktem wyjścia jest nowe rozporządzenie w sprawie europejskich statystyk ludności i mieszkań (ESOP), określające wymagania dotyczące m.in. definicji populacji rezydentów oraz wykorzystania źródeł administracyjnych. Badanie ma na celu opracowanie metodyki wyznaczania populacji rezydentów na potrzeby ESOP, opartej na analizie długości pobytu, miejsca przebywania oraz śladów aktywności administracyjnej w rejestrach.
Metody
Badanie opiera się na danych administracyjnych obejmujących rejestry wykorzystywane do identyfikacji obecności osoby w kraju oraz przypisania jej miejsca pobytu w czasie. Proces badawczy obejmuje: wybór rejestrów i zmiennych, przetwarzanie i czyszczenie danych, ocenę kompletności informacji oraz integrację źródeł. Rekordy zawierające identyfikator PESEL są łączone deterministycznie, natomiast dla rekordów bez tego identyfikatora stosowana jest probabilistyczna integracja danych z użyciem etapu blokowania opartego na przybliżonych najbliższych sąsiadach (ANN) oraz klasyfikacji par z wykorzystaniem algorytmów uczenia maszynowego. Następnie odbywa się imputacja braków danych metodami wielokrotnie odpornej imputacji (ang. multiply robust imputation), identyfikacja faktu przebywania w kraju na podstawie śladów życia, imputacja brakujących informacji o gminie pobytu w kolejnych miesiącach oraz estymacja długości pobytu. Uwzględnienie wymiaru miesięcznego pozwala odtworzyć zmiany miejsca pobytu oraz ciągłość obecności osoby w kraju. Końcowym efektem jest klasyfikacja osób do kategorii pobytu: poniżej 3 miesięcy, od 3 do 12 miesięcy oraz powyżej 12 miesięcy, przy czym ostatnia kategoria odpowiada definicji rezydenta.
Wyniki
Przedstawiona zostanie ocena jakości danych administracyjnych wykorzystywanych do wyznaczania populacji rezydentów, obejmująca kompletność identyfikatorów, skalę braków w źródłach danych, dostępność informacji o gminie pobytu, zgodność informacji między rejestrami oraz użyteczność poszczególnych źródeł jako znaków życia. Analiza zostanie przeprowadzona w ujęciu przekrojowym i miesięcznym, z uwzględnieniem kolejnych etapów procesu badawczego oraz ich znaczenia dla końcowej klasyfikacji osób do populacji rezydentów w Polsce. Wyniki zostaną przedstawione na poziomie gmin w całym analizowanym okresie.
Wnioski
Proponowane podejście może stanowić użyteczne rozwinięcie metod estymacji populacji rezydującej stosowanych w statystyce publicznej. Jego wartość polega na integracji danych administracyjnych, imputacji braków i modelowania długości pobytu. Uzyskane wyniki mogą mieć znaczenie nie tylko metodologiczne, lecz także praktyczne, ponieważ dokładniejsze oszacowania liczby rezydentów wpływają na interpretację wskaźników społeczno-gospodarczych, planowanie usług publicznych oraz ocenę procesów demograficznych na poziomie lokalnym.
Słowa kluczowe:
rezydenci: rejestry administracyjne: długość pobytu: ślady życia
Pobierz prezentację (docx, 1923 kB)Objective
The aim of the presentation is to introduce a method for estimating the number of residents in Poland at the municipality level using integrated administrative registers. The starting point is the new regulation on European statistics on population and housing (ESOP), which defines requirements concerning the resident population and the use of administrative sources. The study aims to develop a methodology for determining the resident population for ESOP purposes, based on length of stay, place of residence, and traces of administrative activity in registers.
Methods
The study is based on administrative data, including registers used to identify a person’s presence in the country and to assign their place of stay over time. The research process includes the selection of registers and variables, data processing and cleaning, assessment of information completeness, and integration of sources. Records containing a PESEL identifier are linked deterministically, while records without this identifier are integrated probabilistically, using a blocking stage based on approximate nearest neighbours (ANN) and pair classification with machine learning algorithms. This is followed by the imputation of missing data using multiply robust imputation methods, identification of a person’s presence in the country based on signs of life, imputation of missing information on the municipality of stay in subsequent months, and estimation of length of stay. Taking the monthly dimension into account makes it possible to reconstruct changes in place of stay and the continuity of a person’s presence in the country. The final outcome is the classification of persons into length-of-stay categories: below 3 months, from 3 to 12 months, and above 12 months, with the last category corresponding to the definition of a resident.
Results
An assessment of the quality of administrative data used to determine the resident population will be presented, covering the completeness of identifiers, the scale of missing data, the availability of information on the municipality of stay, consistency of information between registers, and the usefulness of individual sources as signs of life. The analysis will be carried out in a cross-sectional and monthly perspective, taking into account successive stages of the research process and their importance for the final classification of persons into the resident population. The results will be presented at the municipality level.
Conclusions
The proposed approach may provide a useful extension of methods for estimating the resident population used in official statistics. Its value lies in the integration of administrative data, the imputation of missing values, and the modelling of length of stay. The results may be important not only from a methodological perspective but also in practical terms, as more accurate estimates of the number of residents affect the interpretation of socio-economic indicators, the planning of public services, and the assessment of demographic processes at the local level.
Keywords
residents: administrative registers: length of stay: signs of life
Cel
Celem artykułu jest prezentacja nowatorskiej metody estymacji agregatów statystycznych dla podmiotów podprogowych, które ze względu na niską skalę działalności są wyłączone z obowiązkowej sprawozdawczości. Problemem badawczym jest wysoki koszt i obciążenie respondentów w tradycyjnych metodach uzupełniania braków (spisy, ankiety). Postawiono tezę, że wykorzystanie właściwości matematycznych uciętych rozkładów empirycznych pozwala na precyzyjne odtworzenie parametrów całej populacji bez konieczności zbierania dodatkowych danych od małych i średnich przedsiębiorstw.
Metody
Metodologia opiera się na założeniu, że rozkłady mikrodanych finansowych (np. dochodów, wartości kredytów) są zgodne z rozkładem normalnym, log-normalnym lub innym. Kluczowym elementem metody jest wykorzystanie estymacji parametrów rozkładu uciętego przy pomocy metody momentów oraz twierdzenia o funkcjach uwikłanych. Pozwala to na wyznaczenie parametrów nieobserwowalnej części rozkładu (podprogowej). Jakość wyników oraz stabilność estymatorów może być oceniana poprzez porównanie wyników z danymi z okresowych pełnych spisów (jeśli dostępne) lub poprzez testy wrażliwości na próg ucięcia. Wnioskowanie statystyczne obejmuje analizę błędów ocen dystrybuanty oraz przedziały ufności dla szacowanych agregatów, co pozwala na weryfikację rzetelności podejścia bezkosztowego w porównaniu do metod opartych na próbie losowej. Metoda została zilustrowana na przykładach jedno- i dwuwymiarowych. W badaniu wykorzystano także symulowane dane ze statystyki bilansu płatniczego, dotyczące aktywów i pasywów z tytułu kredytów handlowych. Badanie dotyczy populacji powyżej progu sprawozdawczego (3 mln PLN), co z definicji tworzy zbiór ucięty. Autorzy proponują odejście od kosztownych metod typu census czy survey na rzecz modelowania stochastycznego. Dodatkowo zaprezentowane zostały rozważania o uogólnieniu metody na przypadki wymagające analizy więcej niż dwóch kategorii statystycznych.
Wyniki
Głównym wynikiem pracy jest sformalizowany algorytm odtwarzania pełnego rozkładu statystyki na podstawie jego uciętego fragmentu. Przeprowadzone symulacje na przykładzie problemu podmiotów podprogowych kredytów handlowych w bilansie płatniczym (na symulowanych danych) wykazały wysoką precyzję estymatów. Zaobserwowano, że metoda momentów w połączeniu z twierdzeniem o funkcjach uwikłanych pozwala na skuteczne wyznaczenie wartości dystrybuanty dla podmiotów podprogowych przy zachowaniu niskiego błędu średniokwadratowego. Interpretacja wyników wskazuje, że luka informacyjna powstająca przez progi sprawozdawcze może być systematycznie uzupełniana przy minimalnym błędzie statystycznym, o ile zachowana jest stabilność typu rozkładu w populacji.
Wnioski
Zastosowanie zaproponowanej metody pozwala na istotną redukcję kosztów operacyjnych banków centralnych i urzędów statystycznych oraz zmniejszenie obciążeń biurokratycznych dla sektora mikro i małych przedsiębiorstw. Wkład w rozwój teorii statystyki polega na praktycznym zastosowaniu własności rozkładów uciętych w procesie produkcji statystyki publicznej. Metoda ma charakter uniwersalny i może być uogólniona na przypadki wielowymiarowe oraz inne dziedziny statystyki gospodarczej, gdzie stosuje się progi sprawozdawcze. Stanowi ona realną alternatywę dla tradycyjnych badań ankietowych, wspierając koncepcję nowoczesnej, bezkosztowej statystyki opartej na zaawansowanym modelowaniu matematycznym.
Słowa kluczowe:
: statystyka, podmioty podprogowe, estymacja, rozkład ucięty
Pobierz prezentację (pdf, 107 kB)Objective
The aim of this article is to present a novel method for estimating statistical aggregates for sub-threshold entities that are excluded from mandatory reporting due to their small scale of operation. The research problem addresses the high costs and respondent burden associated with traditional data-gap filling methods, such as censuses and surveys. The thesis posits that leveraging the mathematical properties of truncated empirical distributions allows for the precise reconstruction of parameters for the entire population without the need to collect additional data from small and medium-sized
Methods
The methodology is based on the assumption that the distributions of financial microdata (e.g., income, loan values) conform to normal, log-normal, or other known statistical distributions. A key element of the method is the estimation of truncated distribution parameters using the method of moments and the implicit function theorem. This enables the determination of parameters for the unobservable (sub-threshold) portion of the distribution. The quality of the results and the stability of the estimators can be assessed by comparing the results with data from periodic full censuses (if available) or through sensitivity tests regarding the truncation threshold. Statistical inference includes the analysis of estimation errors of the cumulative distribution function and confidence intervals for the estimated aggregates, allowing for the verification of the reliability of this cost-free approach compared to methods based on random sampling. The method is illustrated with one-dimensional and two-dimensional examples. The study also utilizes simulated data from balance of payments statistics regarding assets and liabilities from trade credits. The study focuses on the population above the reporting threshold (3 million PLN), which by definition creates a truncated set. The authors propose a shift from costly census or survey methods toward stochastic modeling. Furthermore, considerations regarding the generalization of the method to cases requiring the analysis of more than two sta
Results
The primary result of the work is a formalized algorithm for reconstructing a full statistical distribution based on its truncated fragment. Simulations conducted on the problem of sub-threshold entities in trade credit within the balance of payments (using simulated data) demonstrated high precision in the estimates. It was observed that the method of moments combined with the implicit function theorem effectively determines the cumulative distribution function values for sub-threshold entities while maintaining a low mean squared error. The interpretation of the results indicates that the information gap created by reporting thresholds can be systematically closed with minimal statistical error, provided the stability of the distribution type in the population is maintained.
Conclusions
The application of the proposed method allows for a significant reduction in the operating costs of central banks and national statistical offices, as well as a decrease in the bureaucratic burden on the micro and small enterprise sector. The contribution to the development of statistical theory lies in the practical application of truncated distribution properties within the production process of official statistics. The method is universal and can be generalized to multidimensional cases and other areas of economic statistics where reporting thresholds are applied. It serves as a viable alternative to traditional survey research, supporting the concept of modern, cost-free statistics based
Keywords
official statistics. sub-threshold population, estimation, truncated distribution
Cel
Operat PESEL stanowi fundament probabilistycznych badań społecznych w Polsce, w tym kluczowych projektów statystyki publicznej oraz badań akademickich i międzynarodowych. Celem analizy jest empiryczna ocena dwóch warstw degradacji jego komponentu adresowego – braku adresu w rejestrze oraz nieaktualności adresu wśród rekordów formalnie kompletnych – a także odpowiedź na pytanie, w jakim stopniu wynikająca z nich niedostępność dorosłej populacji jest strukturalnie nielosowa i czy może być skutecznie korygowana standardowym ważeniem poststratyfikacyjnym.
Metody
Wykorzystano dane z dwunastu comiesięcznych badań omnibusowych CBOS realizowanych corocznie w latach 2010–2025. Próby losowane są w schemacie probabilistycznym bezpośrednio z rejestru PESEL i obejmują dorosłych mieszkańców Polski. Łączna liczebność prób brutto w analizowanym okresie wynosi około 540 tys. wylosowanych osób (średnio ok. 36 tys. rocznie). Wyniki uogólniane są na populację poprzez ważenie poststratyfikacyjne wg wieku, płci, wielkości miejscowości i regionu, w oparciu o bilanse ludności GUS oraz NSP 2021. Niedostępność operacjonalizowano dwuwarstwowo: (1) brak adresu w wykazie udostępnianym do losowania – traktowany jako błąd pokrycia operatu: (2) niedostępność adresowa potwierdzona w realizacji terenowej – definiowana jako przypadki, w których ankieter ustalił brak rezydencji osoby wylosowanej pod adresem PESEL, a zaproszenie nie zostało skutecznie przekazane także w kanałach alternatywnych (CAWI, CATI, PAPI). Kategoria ta odróżnia się od chwilowego noncontactu i obejmuje przypadki strukturalnej niemożliwości dotarcia. Strukturę niedostępności analizowano w przekrojach wieku, płci, regionu i wielkości miejscowości: skalę zestawiono z liczbą ludności rezydującej publikowaną przez GUS. Oszacowano przedziały ufności dla proporcji oraz zbadano efektywność standardowej kalibracji w usuwaniu obciążenia szacunków.
Wyniki
Łączna niedostępność dorosłej populacji w operacie PESEL wynosi obecnie ok. 20% i obejmuje ok. 6% rekordów bez adresu oraz ok. 14–15% rekordów z adresem, lecz nieprowadzącym do skutecznego kontaktu nawet w mix-mode. We wcześniejszych latach, przed wprowadzeniem kanałów CAWI i CATI w schematach mieszanych, odsetek całkowicie nieosiągalnych był wyższy – mix-mode częściowo, lecz nie w pełni rozwiązuje problem. Niedostępność jest silnie nielosowa: dotyczy częściej osób młodszych, mieszkańców dużych ośrodków oraz regionów o wysokiej mobilności. Standardowe ważenie poststratyfikacyjne tylko częściowo redukuje obciążenie szacunków.
Wnioski
Niedostępność w operacie PESEL przestała być problemem operacyjnym pojedynczych projektów badawczych – jest problemem systemowym statystyki publicznej oraz nauk społecznych w Polsce. Mix-mode redukuje jej wpływ, lecz nie eliminuje twardego rdzenia osób strukturalnie nieosiągalnych. Standardowa kalibracja ma wyczerpujące się granice, ponieważ niedostępni różnią się od dostępnych również wewnątrz strat ważenia. Kierunkiem koniecznym staje się rozwój operatów hybrydowych integrujących PESEL z innymi rejestrami administracyjnymi, zgodnie z dobrymi praktykami statystyki europejskiej.
Słowa kluczowe:
operat PESEL: błąd pokrycia operatu: niedostępność adresowa: ważenie poststratyfikacyjne
Pobierz prezentację (pdf, 106 kB)Objective
The PESEL register provides the backbone of probability-based social research in Poland, including key projects of official statistics as well as academic and international surveys. The aim of this analysis is to empirically assess two layers of degradation of its address component – missing addresses in the register and outdated addresses among formally complete records – and to answer the question of the extent to which the resulting inaccessibility of the adult population is structurally non-random and whether it can be effectively corrected through standard post-stratification weighting.
Methods
The analysis draws on data from twelve monthly omnibus surveys conducted by CBOS each year between 2010 and 2025. Samples are drawn through a probability scheme directly from the PESEL register and cover the adult population of Poland. The total gross sample size over the analysed period amounts to approximately 540,000 sampled individuals (around 36,000 per year on average). Results are generalised to the population through post-stratification weighting by age, sex, locality size, and region, based on Statistics Poland`s current population estimates and the 2021 Polish Census. Inaccessibility was operationalised in two layers: (1) missing address in the list released for sampling – treated as a frame coverage error: (2) address-based inaccessibility confirmed during fieldwork – defined as cases in which the interviewer established that the sampled person did not reside at the PESEL address, and the invitation could not be effectively delivered even through alternative channels (CAWI, CATI, PAPI). This category is distinct from temporary noncontact and captures cases of structural unreachability. The structure of inaccessibility was analysed by age, sex, region, and locality size: its scale was compared against the resident population figures published by Statistics Poland. Confidence intervals for proportions were estimated, and the effectiveness of standard calibration in removing bias from estimates was examined.
Results
Total inaccessibility of the adult population through the PESEL frame currently stands at approximately 20%, comprising about 6% of records with no address and approximately 14–15% of records with an address that does not lead to effective contact even in mixed-mode designs. In earlier years, before CAWI and CATI channels were introduced into mixed-mode schemes, the proportion of fully unreachable persons was higher – mixed-mode mitigates the problem only partially, not fully. Inaccessibility is strongly non-random: it more often affects younger persons, residents of large urban centres, and regions of high mobility. Standard post-stratification weighting only partially reduces estimation bias.
Conclusions
Inaccessibility within the PESEL frame is no longer an operational issue of individual research projects – it is a systemic problem of official statistics and the social sciences in Poland. Mixed-mode designs reduce its impact but do not eliminate the hard core of structurally unreachable persons. Standard calibration is reaching its limits, since the inaccessible differ from the accessible also within weighting strata. The necessary direction of development is the integration of PESEL with other administrative registers, in line with established practices of European official statistics.
Keywords
PESEL register: sampling frame coverage error: address-based inaccessibility: post-stratification weighting:
Cel
Celem badania jest ocena, czy transformacja w kierunku gospodarki o obiegu zamkniętym przyczynia się do zmniejszania zróżnicowań regionalnych w zakresie selektywnej zbiórki odpadów komunalnych w Polsce. Analiza koncentruje się na identyfikacji procesów konwergencji dla wybranych frakcji odpadów oraz na określeniu roli czynników społeczno-ekonomicznych w kształtowaniu tempa i kierunku tych zmian w układzie przestrzennym.
Metody
Badanie oparto na danych panelowych dla polskich powiatów z lat 2017–2024, pozyskanych z Banku Danych Lokalnych GUS. Analiza została przeprowadzona w trzech etapach. W pierwszym zastosowano dynamiczne modele panelowe estymowane metodą system GMM, które pozwoliły na weryfikację hipotezy ß-konwergencji oraz identyfikację efektów heterogeniczności regionalnej i zależności dynamicznych między obserwacjami. W drugim etapie wykorzystano nieparametryczny test log-t Phillipsa i Sula w celu identyfikacji klubów konwergencji oraz oceny istnienia wspólnej ścieżki rozwoju dla analizowanych jednostek. W trzecim etapie zastosowano modele dyskretnego wyboru (logit oraz ordered logit), które umożliwiły określenie wpływu czynników społeczno-ekonomicznych na przynależność powiatów do poszczególnych klubów konwergencji. W modelach panelowych zmienną objaśnianą była wielkość odpadów komunalnych w czterech frakcjach: papieru i tektury, szkła, bioodpadów oraz odpadów wielkogabarytowych. Do zmiennych objaśniających zaliczono m.in. poziom dochodów, stopę bezrobocia, stopień urbanizacji, gęstość zaludnienia, strukturę demograficzną oraz natężenie ruchu turystycznego. Analizy przeprowadzono w programie STATA oraz R.
Wyniki
Wyniki wskazują na występowanie warunkowej ß-konwergencji dla frakcji papieru i tektury, szkła oraz odpadów wielkogabarytowych, co oznacza, że regiony o wyższym początkowym poziomie odpadów, mają niższy poziom ich przyrostu. W przypadku bioodpadów zaobserwowano proces dywergencji, wskazujący na pogłębianie się różnic regionalnych. Test log-t potwierdził brak globalnej konwergencji oraz istnienie kilku klubów konwergencji o wyraźnym zróżnicowaniu przestrzennym. Wyniki modeli wskazują, że czynniki takie jak dochody, urbanizacja, turystyka oraz bezrobocie istotnie wpływają na przynależność do poszczególnych grup.
Wnioski
Transformacja w kierunku gospodarki o obiegu zamkniętym w Polsce prowadzi do ograniczania nierówności regionalnych jedynie w wybranych strumieniach odpadów. Brak globalnej konwergencji oraz obecność klubów konwergencji wskazują na utrzymującą się heterogeniczność systemów gospodarki odpadami. Wyniki sugerują konieczność stosowania zróżnicowanej polityki regionalnej, dostosowanej do lokalnych uwarunkowań społeczno-ekonomicznych. Badanie wnosi wkład do literatury poprzez zastosowanie zaawansowanych metod analizy konwergencji na poziomie subregionalnym.
Słowa kluczowe:
odpady komunalne, konwergencja, powiaty
Pobierz prezentację (docx, 20 kB)Objective
The aim of the study is to assess whether the transition toward a circular economy contributes to reducing regional disparities in separate municipal waste collection in Poland. The analysis focuses on identifying convergence processes across selected waste fractions and examining the role of socio-economic factors in shaping both the pace and direction of these changes across regions over time.
Methods
The study was based on a panel dataset covering Polish counties for the years 2017–2024, obtained from the Local Data Bank of the Central Statistical Office (GUS). The analysis was conducted in three complementary stages. First, dynamic panel models estimated using the system GMM approach were applied to test the hypothesis of ß-convergence and to capture regional heterogeneity as well as dynamic interdependencies between observations over time. Second, the non-parametric Phillips and Sul log-t test was employed to identify convergence clubs and to assess the existence of a common development path across units, allowing for heterogeneous transitional dynamics. Third, discrete choice models (logit and ordered logit) were used to examine the impact of socio-economic factors on the probability of counties belonging to specific convergence clubs. In panel models, the dependent variable was the volume of municipal waste in four fractions: paper and cardboard, glass, bio-waste, and bulky waste. Explanatory variables included income levels, unemployment rate, degree of urbanization, population density, demographic structure, and tourism intensity. All analyses were conducted using STATA and R software, ensuring robustness and comparability of the results.
Results
The results indicate the presence of conditional ß-convergence for paper and cardboard, glass, and bulky waste fractions which means that regions with higher initial waste levels experience lower rates of waste growth. In contrast, a divergence process was observed for bio-waste, indicating increasing regional disparities over time. The log-t test confirmed the absence of global convergence and revealed the existence of several convergence clubs characterized by clear spatial differentiation. The econometric results further show that socio-economic factors such as income levels, degree of urbanization, tourism intensity, and unemployment significantly influence the likelihood of counties belonging to specific convergence groups.
Conclusions
The transition toward a circular economy in Poland contributes to reducing regional inequalities only in selected waste streams. The absence of global convergence and the presence of convergence clubs indicate persistent heterogeneity in waste management systems across regions. These findings highlight the need for differentiated regional policies tailored to local socio-economic conditions rather than uniform national approaches. The study contributes to the literature by applying advanced convergence analysis methods at the subregional level, providing new insights into the spatial dynamics of waste management and circular economy transitions.
Keywords
waste, convergence, counties
Cel
Celem badania jest identyfikacja ukrytych (latentnych) komponentów zachowań sprawozdawczych mikro- i małych przedsiębiorstw oraz ocena, czy dane uzyskane z pytań pośrednich, skorygowane o czynniki behawioralne, mogą stanowić podstawę estymacji w modelu ekonometrycznym ukrytej części przychodów przedsiębiorstw. Analizowana jest możliwość wykorzystania tych informacji do aproksymacji nieobserwowalnych komponentów aktywności ekonomicznej
Metody
Badanie oparto na danych pierwotnych pochodzących z ankiet dotyczących sektora mikro- i małych przedsiębiorstw. Analiza obejmuje lata 2022–2023. Dane mają charakter reprezentatywny dla populacji MŚP. Zastosowano podejście ankietowe, skierowane do właścicieli firm, oparte na pytaniach pośrednich, w którym respondenci pełnili rolę ekspertów wypowiadających się na temat warunków funkcjonowania swoich branż. Przedsiębiorcy wskazywali subiektywnie „satysfakcjonujące” poziomy przychodów, kosztów i dochodów, które wykorzystano do identyfikacji latentnych komponentów sprawozdawczości finansowej. W celu uwzględnienia heterogeniczności behawioralnej skonstruowano Indeks Sentymentu, agregujący deklarowane oczekiwania, motywacje oraz postrzegane warunki prowadzenia działalności. Indeks ten został wykorzystany jako zmienna korygująca w procesie modelowania. Następnie oszacowano strukturalny model ekonometryczny, w którym dokonano dekompozycji oczekiwanych przychodów na komponent obserwowalny oraz latentny. Estymację przeprowadzono z wykorzystaniem metod modelowania strukturalnego, a niepewność oszacowań oceniono przy użyciu standardowych błędów estymacji oraz testów istotności parametrów. Komponent latentny interpretowany jest jako systematyczne odchylenie w subiektywnej sprawozdawczości finansowej, stanowiące modelowe przybliżenie (proxy) nieobserwowalnej aktywności ekonomicznej, a nie bezpośrednią estymację wielkości szarej strefy.
Wyniki
Uzyskane wyniki wskazują na istotne różnice pomiędzy deklarowanymi a skorygowanymi poziomami wyników finansowych w badanej populacji. Wprowadzenie Indeksu Sentymentu pozwala na identyfikację ukrytej struktury w sposobie raportowania danych ekonomicznych przez przedsiębiorców. Komponent latentny okazał się statystycznie istotny i zróżnicowany sektorowo, co sugeruje systematyczny charakter odchyleń w deklaracjach finansowych. Wyniki analizy są częściowo zgodne z dostępnymi szacunkami Głównego Urzędu Statystycznego dotyczącymi szarej strefy, co wskazuje na potencjał zaproponowanego podejścia jako narzędzia jej przybliżonego pomiaru w sektorze MŚP.
Wnioski
Zaprezentowane podejście pokazuje, że dane ankietowe, w połączeniu z korektą behawioralną i modelowaniem strukturalnym, mogą stanowić użyteczne źródło informacji o nieobserwowalnych aspektach aktywności gospodarczej. Zaproponowany model umożliwia lepsze uchwycenie heterogeniczności zachowań sprawozdawczych przedsiębiorców oraz może stanowić uzupełnienie tradycyjnych metod estymacji szarej strefy. Otrzymane wyniki wskazują na możliwość wykorzystania podejścia jako narzędzia wspierającego statystykę publiczną w obszarze pomiaru nieformalnej aktywności gospodarczej.
Słowa kluczowe:
MŚP, szara strefa, dane ankietowe, model ekonometryczny, Indeks Sentymentu
Pobierz prezentację (docx, 18 kB)Objective
This study aims to identify latent components of reporting behavior among micro and small enterprises and to assess whether data obtained from indirect survey questions, adjusted for behavioral factors, can be used in an econometric model to estimate the unobserved component of firm revenues. The analysis explores the potential of such data to approximate non-observable aspects of economic activity.
Methods
The study is based on primary survey data covering micro and small enterprises for the years 2022–2023, with more than 10,000 firms surveyed annually. The dataset is representative of the SME population. An indirect survey approach was applied, in which respondents acted as expert informants on conditions within their industries. Firms reported subjectively “satisfactory” levels of revenues, costs, and income, which were used to identify latent components of financial reporting behavior. To account for behavioral heterogeneity, a Sentiment Index was constructed, aggregating declared expectations, motivations, and perceptions of business conditions. This index was incorporated as a correction variable in the modeling process. A structural econometric model was then estimated, decomposing expected revenues into observable and latent components. Estimation was conducted using structural modeling techniques, and uncertainty was assessed through standard errors and parameter significance tests. The latent component is interpreted as a systematic deviation in subjective financial reporting, serving as a proxy for non-observable economic activity rather than a direct measure of the shadow economy
Results
The findings reveal significant differences between reported and adjusted financial performance in the analyzed population. Incorporating the Sentiment Index allows for the identification of an underlying structure in firms’ reporting behavior. The latent component is statistically significant and varies across sectors, indicating a systematic pattern in reporting deviations. The results are partially consistent with existing estimates of the shadow economy published by the Central Statistical Office (GUS), supporting the potential of the proposed approach as an approximate measurement tool for informal economic activity in the SME sector
Conclusions
The results show statistically significant differences between reported and behaviorally adjusted financial performance. The Sentiment Index reveals systematic patterns in reporting behavior, indicating that declarations are influenced by expectations and perceived conditions. The latent revenue component is significant and varies across sectors, suggesting structured rather than random deviations. The magnitude of these differences indicates that the model captures part of unobserved economic activity. The findings are partly consistent with estimates of the shadow economy published by the Central Statistical Office (GUS), supporting the validity of the approach.
Keywords
SMEs, shadow economy, survey data, econometric model, Sentiment Index
Cel
Celem artykułu jest analiza zmian premii za wykształcenie wyższe w Polsce w latach 2002-2022. Hipotezy badawcze są następujące: (1) Wzrost popytu na umiejętności wywołany postępem technologicznym przekładał się na wzrost premii za wykształcenie wyższe, (2) Silny wzrost podaży pracy osób z wykształceniem wyższym, w szczególności kobiet, był czynnikiem obniżającym premię za wyższe wykształcenie.
Metody
Źródłem danych są dane jednostkowe o indywidualnych płacach i cechach pracodawców i pracowników z Badania Struktury Wynagrodzeń według zawodów. Dane są reprezentatywne dla populacji pracujących w firmach zatrudniających 10 i więcej osób. Wykorzystujemy dane zagregowane w przekroju grup wiekowych, płci i sektorów własności. Podzieliliśmy próbę na siedem grup wiekowych oddzielnie dla mężczyzn i kobiet oraz dla sektora publicznego i prywatnego - łącznie 28 podgrup wiekowo-płciowo-sektorowych. W modelu uwzględniliśmy efekty stałe, aby uwzględnić efekty specyficzne dla danej grupy. Podstawę teoretyczną analiz stanowi kanoniczny model funkcji produkcji Carda i Lemieux (2001), który rozszerzamy na dwa sposoby. Po pierwsze, dodajemy trzeci wymiar (obok wieku i płci) poprzez zróżnicowanie premii za wykształcenie między sektorem publicznym a prywatnym. Po drugie, dopuszczamy zróżnicowanie elastyczności substytucji między czynnikami produkcji w czasie. Interesuje nas oszacowanie wpływu zarówno względnej agregatowej podaży pracowników z wykształceniem wyższym i średnim na wielkość premii z wyższego wykształcenia, a także ocena roli, jaką zmiany w relatywnej podaży pracy w poszczególnych grupach wiekowych, w przekroju płci i sektorów, odegrały w wyjaśnieniu względnego wzrostu zwrotów z wykształcenia wyższego. Weryfikujemy hipotezę o niedoskonałej substytucji między pracownikami z wykształceniem wyższym i średnim, uwzględniając wiek, płeć i sektor.
Wyniki
Wyniki wskazują na istotną rolę zmian względnej agregatowej podaży pracy osób z wykształceniem wyższym lub średnim, jak też istotną rolę zmian względnej podaży pracy w poszczególnych grupach wiekowych, według płci i sektora w wyjaśnianiu zmian premii za wykształcenie wyższe. Rola czynników popytowych była niewielka. Oszacowane wartości częściowej elastyczności substytucji są istotnie wyższe dla kobiet niż dla mężczyzn. Ponadto, różnice sektorowe odgrywają istotną rolę w wyjaśnianiu różnic w wynagrodzeniach. Oszacowane wartości częściowej elastyczności substytucji są istotnie wyższe dla sektora publicznego niż dla sektora prywatnego. Ponadto, wyniki wskazują na wzrost cząstkowej elastyczności substytucji osób z wykształceniem wyższym i średnim w badanym okresie.
Wnioski
Przeprowadzone badania pokazują, że w przeciwieństwie do analiz dla USA, gdzie czynniki popytowe i zmiany technologiczne odgrywały znaczącą rolę w kształtowaniu premii za wyższe wykształcenie, w Polsce kluczową rolę odgrywają zmiany względnej podaży pracy w przekroju wieku, płci i sektora własności. Uzyskane wyniki pokazują, że kobiety w różnych kohortach wiekowych i sektorach są traktowane przez pracodawców jako czynnik produkcji o większym stopniu substytucyjności niż mężczyźni. Wyniki wskazują również na wyższą substytucyjność pracowników o tym samym wykształceniu w sektorze publicznym niż w sektorze prywatnym Wzrost substytucyjności pracowników z wykształceniem średnim i wyższym w czas
Słowa kluczowe:
Premia za wykształcenie, wynagrodzenia, podaż pracy, kohorty wiekowe.
Pobierz prezentację (docx, 18 kB)Objective
The aim of this article is to analyze changes in the higher education premium in Poland between 2002 and 2022. The research hypotheses are as follows: (1) The increase in demand for skills caused by technological progress translated into an increase in the higher education premium, (2) The strong increase in the labor supply of people with higher education, especially women, was a factor reducing the higher education premium.
Methods
The data source is individual data on individual wages and employer and employee characteristics from the Structure of Wages Survey by Occupation. The data are representative of the population working in firms employing 10 or more people. We use aggregated data across age groups, gender, and ownership sectors. We divided the sample into seven age groups, separately for men and women, and for the public and private sectors – a total of 28 age-gender-sector subgroups. We included fixed effects in the model to account for group-specific effects. The theoretical basis for the analyses is the canonical production function model of Card and Lemieux (2001), which we extend in two ways. First, we add a third dimension (besides age and gender) by varying the education premium between the public and private sectors. Second, we allow for the elasticity of substitution between production factors to vary over time. We are interested in estimating the impact of both the relative aggregate supply of workers with tertiary and secondary education on the size of the tertiary education premium, as well as assessing the role that changes in the relative labor supply across age groups, genders, and sectors have played in explaining the relative increase in returns to tertiary education. We test the hypothesis of imperfect substitution between workers with tertiary and secondary education, controlling for age, gender, and sector.
Results
The results indicate a significant role for changes in the relative aggregate labor supply of individuals with higher or secondary education, as well as a significant role for changes in the relative labor supply across age groups, gender, and sector in explaining changes in the higher education premium. The role of demand factors was small. The estimated values ??of the partial substitution elasticity are significantly higher for women than for men. Furthermore, sectoral differences play a significant role in explaining wage differences. The estimated values ??of the partial substitution elasticity are significantly higher for the public sector than for the private sector. Furthermore, the results indicate an increase in the partial substitution elasticity for individuals with higher or
Conclusions
The research shows that, unlike analyses for the US, where demand factors and technological changes played a significant role in shaping the premium for higher education, in Poland, changes in relative labor supply across age, gender, and ownership sector play a key role. The results show that women across age cohorts and sectors are treated by employers as a more substitutable production factor than men. The results also indicate a higher substitutability of workers with the same education in the public sector than in the private sector.
Keywords
Education premium, wages, labor supply, age cohorts.
Cel
Celem referatu jest wyznaczenie funkcjonalnych obszarów miejskich. Problem badawczy dotyczy ograniczeń podejścia stosowanego m.in. przez Eurostat, które koncentruje się na przepływach jednokierunkowych do miast, pomijając powiązania wewnętrzne oraz strumienie wychodzące z ośrodków miejskich. Przyjęto, że zastosowanie metod grafowych pozwala na pełniejsze odwzorowanie rzeczywistych struktur funkcjonalnych oraz relacji między jednostkami terytorialnymi.
Metody
W pracy wykorzystano dane statystyki publicznej pochodzące z badania dojazdów do pracy przeprowadzonego w ramach NSP 2021. Macierz dojazdów do pracy została ze względów porównawczych przekształcona do postaci zawierającej gminy miejsko-wiejskie jako całość czyli bez uwzględniania podziału gmin miejsko-wiejskich na część miejską i wiejską. Zastosowano podejście sieciowe, w którym gminy przedstawiono jako węzły grafu, a przepływy pracowników najemnych między nimi jako ważone krawędzie. Funkcjonalne obszary miejskie zidentyfikowano przy użyciu metod grafowych, w szczególności poprzez algorytmy detekcji społeczności (algorytmy Leiden i Louvain), które umożliwiają wyodrębnienie spójnych strukturalnie grup węzłów o silnych powiązaniach wewnętrznych z uwzględnieniem powiązań obustronnych. W procesie analizy zastosowano również miary centralności, co pozwoliło na identyfikację ośrodków pełniących kluczową rolę w strukturze sieci oraz określenie ich znaczenia w układzie funkcjonalnym. Dodatkowo wykorzystano macierz dostępności opracowaną w ramach statystyk eksperymentalnych GUS, zawierającą czasy przejazdów między gminami. Uzyskane wyniki porównano z innymi delimitacjami funkcjonalnych obszarów miejskich, w tym wyznaczonymi na podstawie metodologii Eurostatu, a różnice oceniono przy użyciu wybranych miar strukturalnych oraz lokalnych grafu.
Wyniki
Otrzymane wyniki wskazują, że zastosowanie metod grafowych prowadzi do identyfikacji funkcjonalnych obszarów miejskich o większej spójności wewnętrznej niż w podejściu tradycyjnym. Podejście sieciowe pozwoliło na uchwycenie obustronnych relacji, co przełożyło się na bardziej realistyczne odwzorowanie struktur funkcjonalnych. Analiza porównawcza wykazała różnice względem istniejących funkcjonalnych obszarów miejskich zwłaszcza w przebiegu granic. Natomiast uwzględnienie dodatkowo macierzy dostępności wzmocniło identyfikowane powiązania między gminami, wpływając na większą spójność wyznaczonych struktur oraz lepsze odzwierciedlenie rzeczywistych warunków transportowych.
Wnioski
Zastosowanie metod grafowych w połączeniu z danymi o dojazdach do pracy stanowi skuteczne narzędzie delimitacji funkcjonalnych obszarów miejskich. Podejście to umożliwia lepsze uchwycenie rzeczywistych struktur funkcjonalnych oraz relacji przestrzennych. Wyniki wskazują, że analiza sieciowa może stanowić istotne wsparcie dla planowania przestrzennego i polityki regionalnej, umożliwiając bardziej precyzyjne definiowanie obszarów oddziaływania ośrodków miejskich. Dodatkowo uwzględnienie innych typów przepływów, takich jak dojazdy do szkół, pozwala na pełniejsze uchwycenie wielowymiarowego charakteru powiązań między jednostkami terytorialnymi.
Słowa kluczowe:
funkcjonalne obszary miejskie, grafy, detekcja społeczności, dostępność przestrzenna, dojazdy do pracy / szkół
Pobierz prezentację (docx, 18 kB)Objective
The aim of this paper is to define functional urban areas. The research problem addresses the limitations of approaches used by, among others, Eurostat, which focus on one-way commuting flows into cities while ignoring internal linkages and outbound flows from urban centers. It is assumed that the application of graph methods enables a more comprehensive representation of actual functional structures and relationships between territorial units.
Methods
This study used public statistics data from the commuting survey conducted as part of the 2021 National Census. For comparative purposes, the commuting matrix was transformed to treat urban-rural municipalities as single units, without distinguishing between their urban and rural parts. A network approach was applied, in which municipalities were represented as graph nodes and flows of employed workers between them as weighted edges. Functional urban areas were identified using graph methods, particularly community detection algorithms (Leiden and Louvain), which allow the identification of structurally coherent groups of nodes with strong internal connections while taking bilateral relations into account. Centrality measures were also employed to identify centers playing key roles in the network structure and to determine their importance within the functional system. Additionally, an accessibility matrix developed as part of the experimental statistics of the Central Statistical Office (GUS) was used, containing travel times between municipalities. The obtained results were compared with other delimitations of functional urban areas, including those based on the Eurostat methodology. Differences were assessed using selected structural measures and local graphs.
Results
The results indicate that the use of graph methods leads to the identification of functional urban areas with greater internal cohesion than the traditional approach. The network approach enabled the capture of bilateral relationships, resulting in a more realistic representation of functional structures. Comparative analysis revealed differences from existing delimitations of functional urban areas, especially regarding boundary delineation. Furthermore, the inclusion of the accessibility matrix strengthened the identified connections between municipalities, contributing to greater cohesion of the identified structures and a better reflection of actual transport conditions.
Conclusions
The use of graph methods combined with commuting data provides an effective tool for delimiting functional urban areas. This approach allows for a better understanding of actual functional structures and spatial relationships. The results indicate that network analysis can significantly support spatial planning and regional policy by enabling a more precise definition of urban catchment areas. Furthermore, incorporating other types of flows, such as commuting to school, allows for a more comprehensive understanding of the multidimensional nature of connections between territorial units.
Keywords
functional urban areas, graphs, community detection, spatial accessibility, commuting to work, commuting to school
Objective
Methods
Results
Conclusions
Keywords
Pobierz prezentację (docx, 17 kB)Objective
The study examines economic resilience from a micro-spatial perspective, focusing on how local industrial structures and firm dynamics shape variation within regions. Resilience is defined through four components: resistance, recovery, renewal, and reorientation. The paper introduces a grid-level measure - the Local Industrial Resilience Index (LIRI), to identify neighbourhood-level patterns and assess how diversity, specialisation and related variety are associated with local resilience.
Methods
The analysis is based on geo-referenced firm-level data from the REGON register for the Mazowieckie region (Poland), covering two cross-sections: 2012 and 2021. The study uses the full population of firms (approximately 989,000 in 2012 and 1.11 million in 2021), rather than a sample, which eliminates sampling-related uncertainty and the need for statistical inference based on sampling error. Firms are assigned to a regular 2×2 km grid (approximately 9,320 cells), enabling a fine-grained spatial analysis. The study introduces LIRI, a composite measure integrating four dimensions of resilience: resistance, recovery, renewal, and reorientation. The index combines information on firm survival and entry with indicators of local industrial structure, including diversity, specialisation, concentration, and related variety. Resistance and recovery are estimated as standardised residuals from econometric models (binomial model for firm survival and negative binomial model for firm births), comparing observed and expected values. Renewal and reorientation capture entries into related and unrelated sectors, based on measures of sectoral relatedness derived from co-occurrence patterns. This approach allows controlling for structural characteristics and identifying deviations from expected dynamics at the local level.
Results
The results show that economic resilience varies significantly across space and does not follow a simple core-periphery pattern. While the Warsaw metropolitan core exhibits high resilience, several medium-sized towns also demonstrate strong adaptive capacity. In contrast, many peripheral and mono-industrial areas remain structurally vulnerable. Related variety emerges as a key factor supporting both firm survival and renewal, whereas high sectoral concentration is associated with weaker resilience across all dimensions. These findings highlight the importance of local industrial structure in shaping resilience outcomes.
Conclusions
The results indicate that regional resilience is shaped by local industrial structures rather than scale alone. Areas characterised by greater diversity and related variety show higher adaptive capacity, while sectoral concentration increases vulnerability to shocks. The proposed LIRI measure provides a consistent framework for analysing resilience at a fine spatial scale. The findings contribute to empirical research on resilience and offer useful insights for place-based regional policy, particularly in supporting diversification and strengthening local economic linkages.
Keywords
composite measure: local resilience: firm resistance: firm renewal: spatial analysis
Cel
Zmienne kategoryczne, takie jak klasyfikacje zawodów (ISCO / KZIS) czy działalności gospodarczej (NACE / PKD), często zmieniają kodowanie między falami badań, co uniemożliwia porównania longitudinalne. Celem badania jest przedstawienie metody cat2cat do harmonizacji niespójnie kodowanych zmiennych kategorycznych oraz zademonstrowanie jej empirycznego zastosowania do analizy relacji między strukturą wieku a wynagrodzeniami w grupach zawodowych na danych z Badania Struktury Wynagrodzeń (2006–2014).
Metody
Metoda cat2cat została pierwotnie zaproponowana przez Nasińskiego, Majchrowską i Broniatowską (2020), następnie sformalizowana i rozszerzona przez Nasińskiego i Gajowniczka (2023). Metoda została dalej udoskonalona w wyniku recenzji eksperckiej, m.in. w zakresie obsługi błędów i transparentności diagnostycznej. Algorytm cat2cat wykorzystuje tablicę przejść. Mapowanie jest dwukierunkowe, umożliwiając harmonizację zarówno ze starego kodowania do nowego, jak i odwrotnie. Jeżeli kodowanie wynika z ewolucji klasyfikacji, to mapowanie nowego kodowania (bardziej szczegółowe) do starego (mniej szczegółowe) jest często niejednoznaczne, natomiast mapowanie w odwrotnym kierunku może być w większym stopniu jednoznaczne. Rewizja KZIS w 2010 r. objęła ok. 85% kodów 4-cyfrowych, uniemożliwiając dotychczas analizę wynagrodzeń w poszczególnych grupach zawodowych w czasie. Dzięki harmonizacji metodą cat2cat przywrócono porównywalność danych z SWZ za lata 2006–2014 i oszacowano rozszerzone równanie płac Mincera na poziomie 3-cyfrowych grup zawodowych. Badaną zmienną w modelu jest odsetek osób w wieku 55–65 lat w danej grupie zawodowej. Zastosowanie empiryczne wykorzystuje 5 fal Badania Struktury Wynagrodzeń (SWZ, 2006–2014, ok. 700 tys. obserwacji na falę). Do uogólnienia wyników na populację wykorzystano zmienną mnożnik z SWZ.
Wyniki
W regresji na pełnej próbie współczynnik struktury wieku zmieniał się istotnie w czasie: przed 2010 r. był ujemny bądź bliski zeru, a po 2010 r. stał się dodatni, co może wskazywać na zanikanie premii stażowej (*seniority premium*) charakterystycznej dla wcześniejszego okresu. Na poziomie zagregowanym dla grupy Specjalistów odnotowano nieoczekiwanie silnie ujemną korelację płac z udziałem starszych pracowników. Dezagregacja na poziom 3-cyfrowy ujawniła jednak zróżnicowanie wewnętrzne — przykładowo wynagrodzenia starszych lekarzy rosną wraz z doświadczeniem, natomiast wiedza starszych inżynierów i specjalistów IT może ulegać dezaktualizacji.
Wnioski
Metoda cat2cat, rozwijana od koncepcji (2020) przez formalizację i implementację open source (R / Python, 2023) po udoskonalenia po recenzji eksperckiej, stanowi narzędzie do harmonizacji ewoluujących klasyfikacji w danych longitudinalnych. Zastosowanie do danych z SWZ potwierdza użyteczność metody i dostarcza nowych ustaleń o heterogeniczności relacji między strukturą wieku a wynagrodzeniami w grupach zawodowych. Metodologia ma zastosowanie tam, gdzie kodowania kategoryczne zmieniają się w czasie, np. w epidemiologii (ICD) czy statystyce działalności (NACE).
Słowa kluczowe:
harmonizacja danych, zmienne kategoryczne, badania longitudinalne, uczenie maszynowe, oprogramowanie statystyczne
Pobierz prezentację (docx, 24 kB)Objective
Categorical variables such as occupation (ISCO) or industry (NACE) classifications frequently change their encoding between survey waves, which precludes longitudinal comparisons. This study presents the cat2cat method for harmonizing inconsistently coded categorical variables and demonstrates its empirical application to the analysis of the relationship between age structure and wages across occupational groups using Polish Structure of Wages and Salaries Survey data (2006–2014).
Methods
The cat2cat method was originally proposed by Nasiński, Majchrowska, and Broniatowska (2020), subsequently formalized and extended by Nasiński and Gajowniczek (2023). The method has been further refined following expert review, including improvements in error handling and diagnostic transparency. The cat2cat algorithm uses a transition table for harmonization. The mapping is bidirectional, enabling harmonization from old encoding to new and vice versa. When encoding results from classification evolution, mapping of the new (more detailed) encoding to the old (less detailed) one is often ambiguous, whereas the reverse mapping may be more straightforward. The 2010 revision of the Polish Classification of Occupations (KZIS) affected approximately 85% of 4-digit codes, previously precluding the analysis of wages across specific occupational groups over time. Using the cat2cat method, comparability of SWZ data for 2006–2014 was restored and an augmented Mincer wage equation was estimated at the 3-digit occupational group level. The variable of interest is the share of workers aged 55–65 in a given occupational group. The empirical application uses 5 waves of the Structure of Wages and Salaries Survey (SWZ, 2006–2014, approx. 700,000 observations per wave). The design weight variable from SWZ was used to generalize results to the population.
Results
In the full-sample regression, the age structure coefficient changed significantly over time: before 2010 it was negative or near zero, whereas after 2010 it became positive, potentially indicating the decline of a *seniority premium* characteristic of the earlier period. At the aggregate level for Professionals, an unexpectedly strong negative correlation between wages and the share of older workers was observed. Disaggregation to the 3-digit level, however, revealed considerable internal variation — for example, wages of older physicians increase with experience, whereas the knowledge of older engineers and IT specialists may become obsolete.
Conclusions
The cat2cat method, progressively developed from an initial concept (2020) through formalization and open-source implementation (2023, R / Python) to further refinements informed by expert review, provides a complete tool for harmonizing evolving categorical classifications in longitudinal data. Its application to Polish wage data demonstrates both the practical utility of the method and novel findings on the heterogeneity of the relationship between age structure and wages across occupational groups. The methodology is applicable wherever categorical encodings change over time, including epidemiology (ICD) and economic activity statistics (NACE).
Keywords
data harmonization, categorical variables, longitudinal studies, machine learning, statistical software
Cel
Celem wystąpienia jest zaprezentowanie podejścia metodologicznego do wykorzystania danych pochodzących z ofert pracy jako pozastatystycznego źródła informacji o rynku pracy w badaniu zapotrzebowania na umiejętności. W szczególności omówione zostaną etapy przetwarzania oraz analizy tych danych. Ponadto celem jest wskazanie, w jaki sposób odpowiednio zaprojektowane podejście metodologiczne pozwala na zwiększenie użyteczności danych z ofert pracy w badaniach rynku pracy, przy jednoczesnym uwzględnieniu ograniczeń związanych z ich jakością, reprezentatywnością oraz specyfiką tego typu źródeł.
Metody
W opisywanym modelu wykorzystano podejście badawcze łączące analizę jakościową i ilościową w celu kompleksowego uchwycenia struktury oraz dynamiki zapotrzebowania na umiejętności w wybranych zawodach na podstawie internetowych ofert pracy. Przyjęta perspektywa zakłada zastosowanie komplementarnych technik analitycznych, co pozwala na zwiększenie trafności wnioskowania oraz redukcję ograniczeń wykorzystania wynikających ze specyfiki żródła. W prezentowanym podejściu badawczym, w analizie jakościowej wykorzystano metody eksploracyjne, w tym analizę treści oraz podejścia właściwe dla przetwarzania języka naturalnego (NLP), umożliwiające m.in. identyfikację i standaryzację nazw kategorii umiejętności. Równolegle zastosowano procedury kategoryzacji w celu budowy schematu grupowania umiejętności, prowadzące do opracowania uporządkowanej, autorskiej klasyfikacji umiejętności, wykorzystanej w dalszej analizie. W analizie ilościowej wykorzystano opis statystyczny oraz elementy uczenia maszynowego, w tym techniki grupowania, analizy współwystępowania, co pozwoliło na przetestowanie alternatywnej metody identyfikacji kluczowych umiejętności w określonych zawodach. Źródła danych obejmowały dane pochodzące z internetowych portali rekrutacyjnych, zawierające opisy ofert pracy. Analiza została przeprowadzona na próbie celowej treści ofert pracy wybranych zawodów w ramach której w okresie od 2018 do 2025 roku analizie poddanych zostało ponad 26 milionów wystąpień oczekiwanych umiejętności.
Wyniki
Zaprezentowane zostaną kluczowe rezultaty, w tym model analizy umiejętności obejmujący etapy od doboru obserwacji po szablon prezentacji najważniejszych informacji. W ramach prowadzonych prac opracowane zostało zestawienie kluczowych megatrendów, na ich podstawie, wyznaczono kierunki identyfikacji zawodów przyszłości a następnie przygotowano listę zawodów wybranych do analizy. Z przeprowadzonej analizy wynika, że postępująca cyfryzacja, obejmująca praktycznie wszystkie sektory gospodarki, generuje rosnące zapotrzebowanie na nowe i zaktualizowane umiejętności pracowników. W związku z tym szczególną uwagę poświęcono identyfikacji i charakterystyce tych potrzeb, co pozwala na uchwycenie zmian zachodzących na współczesnym rynku pracy w tym obszarze.
Wnioski
Opracowany w ramach prac model analityczny umiejętności jest przykładem tego, w jaki sposób odpowiednio zaprojektowane podejście metodologiczne pozwala na zwiększenie użyteczności danych z ofert pracy w badaniach rynku pracy, przy jednoczesnym uwzględnieniu ograniczeń związanych z ich jakością, reprezentatywnością oraz specyfiką tego typu źródeł. Źródło danych jakim jest baza OJA może uzupełniać analizy zapotrzebowania na pracowników, analizy zmian na rynku pracy, przyczyniając się do lepszego dopasowania edukacji do rynku pracy, może wpierać identyfikowanie luk kompetencyjnych czy uzupełniać informacje pochodzące z danych statystycznych.
Słowa kluczowe:
internetowe oferty pracy, zapotrzebowanie na umiejętności, nowe źródła danych, webscraping, ISCO
Pobierz prezentację (docx, 27 kB)Objective
The aim of the presentation is to present a methodological approach to using data from online job advertisements as a non-statistical source of labor market information in the study of skills requirement. In particular, we will discuss how the data were processed and analyzed. Additionally, the objective is to demonstrate how a properly designed methodological approach can enhance the usefulness of job advertisement data in labor market research, while taking into account limitations related to data quality, representativeness, and the specific nature of this type of source.
Methods
In the described model, a research approach combining qualitative and quantitative analysis was applied in order to comprehensively capture the structure and dynamics of skills requirement in selected occupations based on online job advertisements. The adopted perspective assumes the use of complementary analytical techniques, which increases the validity of inference and reduces the limitations arising from the specific nature of the data source. In the presented research approach, exploratory methods were used in the qualitative analysis, including content analysis and approaches specific to natural language processing (NLP), enabling, among others, the identification and standardization of skill category names. Categorization procedures were applied to develop a skills grouping framework, leading to the creation of a structured, original classification of skills used in further analysis. In the quantitative analysis, statistical description and elements of machine learning were employed, including clustering techniques and co-occurrence analysis, which made it possible to test an alternative method for identifying key skills in specific occupations. The data sources included information from online portals containing job advertisements. The analysis was conducted on a purposive sample of online job advertisements for selected occupations, within which more than 26 million instances of required skills were analyzed over the period from 2018 to 2025.
Results
The skills analytical model developed as part of this work is an example of how a properly designed methodological approach can increase the usefulness of job advertisement data in labour market research, while taking into account limitations related to data quality, representativeness, and the specific nature of this type of source. The OJA database as a data source can supplement analyses of labour demand and labour market changes, contributing to a better alignment between education and the labour market. It can also support the identification of skills gaps and supplement information derived from statistical data.
Conclusions
The skills analytical model developed as part of this work is an example of how a properly designed methodological approach can enhance the usefulness of job advertisement data in labor market research, while taking into account limitations related to data quality, representativeness, and the specific nature of such sources. The OJA database as a data source can support analyses of labour demand and labour market changes, contributing to a better alignment between education and labor market needs. It can also support the identification of skills gaps and supplement information derived from statistical data.
Keywords
online job advertisements, skills demand, new data sources, web scraping, ISCO
Cel
Niniejsze badanie zapewnia kompleksową globalną walidację i rozszerzenie modelu entropii i produktu marginalnego wprowadzonego przez Bwanakare, Cierpiał-Wolan i Niniejsze badanie ma na celu kompleksową globalną walidację i rozszerzenie modelu entropii i produktu marginalnego wprowadzonego przez Bwanakare, Cierpiał-Wolan i Rzeczkowskiego (2025), w celu potwierdzenia ich przełomowej hipotezy teoretycznej, że emisje CO2 są fundamentalnie napędzane przez interakcję między termodynamiczną efektywnością entropii a energetyczną produktywnością marginalną.
Metody
Badanie rozszerza analizę empiryczną na 127 krajów w ciągu 23 lat, obejmując okres od 2000 do 2022 roku, co reprezentuje 98,4% globalnych emisji CO2. Ramy teoretyczne opierają się na entropii nieekstensywnej, wykorzystując statystykę Tsallisa z nieekstensywnym parametrem entropii (q), w przeciwieństwie do konwencjonalnej statystyki Boltzmanna-Gibbsa. Takie podejście jest zgodne z teoretyczną prognozą Bwanakare`a z lat 2014, 2015 i 2017 dotyczącą systemów gospodarczo-energetycznych. Jako kluczową metrykę analityczną zastosowano stosunek entropii do produktu marginalnego (?). Metody analityczne obejmują ekonometrię przestrzenną do identyfikacji efektów ubocznych między krajami, analizę heterogeniczności ? na różnych etapach rozwoju gospodarczego oraz porównanie mocy wyjaśniającej z konwencjonalnymi wskaźnikami intensywności energetycznej. Badanie uwzględnia również prognozowanie poza próbą, analizę temporalnego wzmocnienia ? oraz optymalizację alokacji finansowania klimatycznego.
Wyniki
Wyniki potwierdzają główną hipotezę, wykazując że stosunek ? osiąga moc wyjaśniającą R2 od 0,847 do 0,923, przewyższając konwencjonalne wskaźniki (R2 = 0,521-0,687) z poprawą predykcyjną 35-62%. Udokumentowano systematyczną heterogeniczność ?: gospodarki rozwinięte 0,847, rynki wschodzące 0,789, kraje rozwijające się 0,712. Wzmocnienie temporalne wynosi +36% od 2000 roku, z przyspieszeniem +16,6% po Porozumieniu Paryskim. Analiza przestrzenna ujawnia istotne efekty uboczne (? = 0,156, p * 0,001). Alokacja finansowania zoptymalizowana pod kątem entropii osiąga o 26,3% wyższą efektywność niż podejścia oparte na PKB. Parametr q przekracza jedność (średnia: 1,21, zakres: 1,12-1,31), potwierdzając konieczność statystyki Tsallisa.
Wnioski
Badanie stanowi przełom w rozumieniu mechanizmów emisji CO2, dowodząc empirycznie konieczności opisu systemów gospodarczo-energetycznych w ramach termodynamiki nieekstensywnej. Metryka iloczynu entropii i produktu marginalnego umożliwia identyfikację punktów interwencji o wysokim wpływie oraz optymalizację alokacji zasobów. Wykazana o 26,3% wyższa efektywność kosztowa sugeruje, że decydenci powinni przyjąć ramy entropii nieekstensywnej jako podstawę polityki klimatycznej. Zidentyfikowane efekty uboczne między krajami podkreślają znaczenie międzynarodowej koordynacji, a systematyczna heterogeniczność ? wskazuje na potrzebę różnicowania polityk w zależności od poziomu rozwoju kraju.
Słowa kluczowe:
prognozowanie emisji CO₂: entropia Tsallisa: produkt marginalny energii: efektywność termodynamiczna: ekonometria panelowa
Pobierz prezentację (docx, 22 kB)Objective
This study aims to provide a comprehensive global validation and extension of the entropy-marginal product model introduced by Bwanakare, Cierpiał-Wolan, and Rzeczkowski (2025), confirming their groundbreaking theoretical hypothesis that CO2 emissions are fundamentally driven by the interaction between thermodynamic entropy efficiency and energy marginal productivity. The research seeks to establish universal applicability of this framework across diverse economic systems and development stages, while demonstrating its superior predictive power compared to conventional energy intensity metrics
Methods
The study analyzes 127 countries over 23 years (2000-2022), representing 98.4% of global CO2 emissions. The theoretical framework utilizes nonextensive entropy based on Tsallis statistics with parameter (q), opposing conventional Boltzmann-Gibbs statistics. This aligns with Bwanakare`s theoretical predictions that economic-energy systems exhibit long-range dependencies inadequately captured by extensive thermodynamic frameworks. The entropy-to-marginal product ratio (?) serves as the key analytical metric. Analytical methods include spatial econometrics identifying cross-country spillover effects, panel regression with fixed and random effects controlling for heterogeneity, and dynamic modeling capturing temporal ? evolution. The study analyzes ? heterogeneity across developed economies, emerging markets, and developing nations. Comparative analysis evaluates explanatory power between the entropy-marginal product framework and conventional indicators including energy-to-GDP ratios and carbon intensity metrics. The research incorporates out-of-sample forecasting, temporal trend analysis, and optimization modeling for climate finance allocation. Robustness checks include sensitivity analysis for parameter q and cross-validation procedures ensuring reliability across contexts.
Results
The results confirm the main hypothesis, demonstrating that the ? ratio achieves explanatory power of R2 ranging from 0.847 to 0.923, surpassing conventional indicators (R2 = 0.521-0.687) with predictive improvement of 35-62%. Systematic heterogeneity of ? was documented: developed economies 0.847, emerging markets 0.789, developing countries 0.712. Temporal reinforcement amounts to +36% since 2000, with acceleration of +16.6% after the Paris Agreement. Spatial analysis reveals significant spillover effects (? = 0.156, p * 0.001). Entropy-optimized finance allocation achieves 26.3% higher cost-efficiency than GDP-based approaches. The parameter q exceeds unity (mean: 1.21, range: 1.12-1.31), confirming the necessity of Tsallis statistics.
Conclusions
The study represents a breakthrough in understanding CO2 emission mechanisms, empirically demonstrating the necessity of describing economic-energy systems within the framework of nonextensive thermodynamics. The entropy-marginal product metric enables identification of high-impact intervention points and optimization of resource allocation. The demonstrated 26.3% higher cost-efficiency suggests that policymakers should adopt the nonextensive entropy framework as the foundation for climate policy. Identified cross-country spillover effects underscore the importance of international coordination, while systematic ? heterogeneity indicates the need to differentiate policies according to countr
Keywords
CO₂ emissions forecasting: Tsallis entropy: marginal product of energy: thermodynamic efficiency: panel econometrics
Cel
Celem niniejszego badania jest analiza wpływu dostępności transportu publicznego na rynek pracy w Polsce. W tym celu wykorzystana zostanie regresja ważona geograficznie (GWR) w celu zbadania zmienności przestrzennej tej zależności oraz określenia, które obszary Polski mogłyby odnieść największe korzyści ze zwiększenia dostępności. W oparciu o cel badania sformułowano następujące hipotezy badawcze: 1. Modele GWR lepiej opisują badaną zależność niż modele MNK: 2. Zależność między dostępnością transportową a stopą bezrobocia jest istotna i ujemna.
Metody
W celu zbadania wpływu dostępności transportu publicznego na poziom bezrobocia wykorzystano metodę najmniejszych kwadratów oraz regresję ważoną geograficznie (Brunsdon, Fotheringham i Charlton, 1996), opierając się na danych z Banku Danych Lokalnych (GUS) za rok 2023 na poziomie poszczególnych gmin. Zmienną zależną w badaniu jest odsetek zarejestrowanych bezrobotnych w populacji w wieku produkcyjnym w danej gminie. Główną zmienną niezależną, na której skupia się analiza, jest opracowany wskaźnik dostępności transportowej, który uwzględnia liczbę przystanków autobusowych w gminie na kilometr kwadratowy, wydatki gminy na transport na mieszkańca, liczbę przewoźników zarejestrowanych w województwie na 100000 mieszkańców, gęstość sieci transportowej w województwie oraz gęstość sieci kolejowej w powiecie. Kluczowym elementem analizy będzie zbadanie wpływu tej zmiennej na stopę bezrobocia. Oczekuje się ujemnej zależności między dostępnością a stopą bezrobocia. Ponadto w modelu uwzględniono zmienne kontrolne, zarówno demograficzne, jak i ekonomiczne, a także podział na typy gmin (miejskie, miejsko-wiejskie, wiejskie), aby uniknąć błędu pominięcia istotnych zmiennych. Przeanalizowane zostaną dwa modele GWR: pierwszy z wykorzystaniem indywidualnego wskaźnika dostępności transportowej dla gminy, a drugi z wykorzystaniem zmiennej określającej średnią dostępność transportową powiatu, w którym znajduje się dana gmina.
Wyniki
Trzy testy zaproponowane przez Leunga i in. (2000a) i przeprowadzone na modelach GWR wykazały, że modele lokalne znacznie lepiej opisują zależności między zmiennymi niż ich odpowiedniki globalne. Test oparty na statystyce I Morana, opisany przez Leunga i in. (2000b), wykazał, że podejście przestrzenne w modelowaniu bezrobocia daje lepsze wyniki niż podejście nieprzestrzenne. Rozkład przestrzenny wartości współczynników regresji dla zmiennej dostępności transportowej wykazuje znaczne zróżnicowanie w obu analizowanych modelach. W każdym modelu mediana współczynnika jest ujemna, co pozwala stwierdzić, że w przypadku większości gmin poprawa dostępności transportowej wiąże się ze spadkiem stopy bezrobocia.
Wnioski
Dostępność transportowa okazała się istotną zmienną wyjaśniającą poziom bezrobocia, choć jej wpływ nie był jednakowy w całym kraju. W większości gmin współczynnik regresji dla dostępności transportowej był ujemny, co potwierdza oczekiwany ujemny związek między dostępnością transportową a poziomem bezrobocia. Zmienna ta była jednak statystycznie istotna jedynie w wybranych regionach, głównie na peryferiach województw, a zwłaszcza w regionach przygranicznych. Sugeruje to, że poprawa dostępności transportowej może być szczególnie skuteczna w ograniczaniu bezrobocia na obszarach odizolowanych, najbardziej narażonych na wykluczenie transportowe.
Słowa kluczowe:
dostępność transportowa, stopa bezrobocia, regresja ważona geograficznie, wykluczenie transportowe, niedopasowanie przestrzenne
Pobierz prezentację (docx, 20 kB)Objective
This study aims to examine how public transport accessibility affects the labour market in Poland. To this end, geographically weighted regression (GWR) will be used to examine the spatial variability of this relationship and to identify which areas of Poland could benefit most from increased accessibility. Based on the objective of the study, the following research hypotheses were formulated: 1. GWR models better describes the examined relationship than OLS models: 2. The relationship between the transport accessibility and the unemployment rate is significant and negative.
Methods
OLS and Geographically Weighted Regression (Brunsdon, Fotheringham * Charlton (1996)) were used to examine the impact of public transport availability on unemployment levels, using data from the Local Data Bank (Polish Statistics) for 2023 at the level of individual municipalities. The dependent variable in the study is the share of registered unemployed persons in the working-age population in the municipality. The main independent variable on which the analysis focuses is the developed transport accessibility index, which takes into account number of bus stops in the municipality per square kilometre, municipal expenditure on transport per capita, number of carriers registered in the voivodeship per 100,000 inhabitants, transport network density in the voivodeship, rail network density in the poviat. A key element of the analysis will be to examine the impact of this variable on the unemployment rate. A negative relationship between accessibility and the unemployment rate is expected. In addition, control variables, both demographic and economic, as well as a division into types of municipalities (urban, urban-rural, rural) were included in the model in order to avoid the error of omitting important variables. Two GWR models will be analysed: first, using an individual transport accessibility indicator for the municipality, and second, using a variable that determines the average transport accessibility of the poviat in which the municipality is located.
Results
The three tests proposed in Leung et al. (2000a) performed on GWR models showe that local models describe the relationships between variables much better than their global counterparts. Test based on Moran`s I statistic from Leung et al. (2000b) showed that spatial approach in modelling unemployment performs better than a-spatial. The spatial distribution of the regression coefficient values for the transport accessibility variable shows significant variation in both models analysed. In each model, the median coefficient is negative, which allows us to conclude that for most municipalities, improved transport accessibility is associated with a decrease in the unemployment rate.
Conclusions
Transport accessibility proved to be a significant variable explaining the level of unemployment, although its impact was not uniform across the country. In most municipalities, the regression coefficient for accessibility was negative, confirming the expected negative relationship between transport accessibility and unemployment levels. However, this variable was statistically significant only in selected regions, mainly on the peripheries of voivodeships, especially in border regions. This suggests that improving transport accessibility may be particularly effective in reducing unemployment in isolated areas most vulnerable to transport exclusion.
Keywords
transport accessibility, unemployment rate, geographically weighted regression, transport exclusion, spatial mismatch
Cel
Celem prezentacji jest dyskusja nad własnościami elementarnego indeksu cen Younga-Balka-Mehrhoffa-Dikhanova (YBMD), który z jednej strony nie jest zbyt dobrze rozpoznany w literaturze przedmiotu, z drugiej jednak strony ma potencjał by służyć jako bardzo dobra alternatywa dla rekomendowanego przez manuale do CPI i HICP indeksu Jevonsa. W szczególności, celem referatu jest wskazanie tych sytuacji, gdy statystyczne własności indeksu YBMD przewyższają odpowiednie własności indeksy Jevonsa.
Metody
Metody badawcze, służące realizacji opisanego celu, to (1) metoda analityczna, polegająca na formalnym, matematycznym dowodzie wybranych własności indeksu YBMD oraz (2) badanie empiryczne, bazujące na danych zbieranych przez ankieterów urzędów statystycznych (dane z 207 rejonów w Polsce dotyczące cukru oraz rowerów) oraz na danych skrapowanych (skrapowano ceny ryżu, jogurty, cukru i kawy ze strony www jednej z sieci handlowej w Polsce). W ramach metody analitycznej, wyprowadzono wzory na obciążenie, wariancję i MSE próbkowego indeksu YBMD oraz zbadano jego własności przy założeniu log-normalnych cen i uwzględniając skorelowanie cen z okresu bazowego i badanego. W badaniu empirycznym, w przypadku danych pochodzących z rejonów notowań, wykorzystano 207 cen wspomnianych produktów z każdego miesiąca objętego badaniem, a w przypadku danych skrapowanych, w zależności od produktu, dziennie pozyskiwano od kilkunastu do kilkudziesięciu obserwacji w zależności od liczby dostępnych kodów EAN danego produktu na witrynie www skrapowanej sieci handlowej. W badaniu empirycznym nie uogólniano wniosków z pobranych prób, natomiast uwagę skupiono na ustaleniu relacji jakie zachodzą między wartościami próbkowych elementarnych indeksów cen, w tym indeksu YBMD.
Wyniki
Wyniki uzyskane w pracy jednoznacznie wskazują na szereg korzyści związanych ze stosowaniem indeksu YBMD na elementarnym poziomie agregacji danych CPI. W szczególności, głównym wynikiem teoretycznym jest wykazanie, iż (a) przy log-normalnych cenach, próbkowy indeks YBMD jest asymptotycznie nieobciążonym estymatorem populacyjnego indeksu YBMD: (b) obciążenie i błąd średnio-kwadratowy (MSE) próbkowego indeksu YBMD wyraźnie zależy od kierunki i siły korelacji pomiędzy cenami bazowymi i bieżącymi: (c) wykazano istnienie takich zestawów cen bazowych i bieżących, w obrębie których obciążenie i MSE indeksu YBMD będą zawsze mniejsze od analogicznych charakterystyk dla indeksu Jevonsa. Wyniki empiryczne wskazują natomiast na wzajemną aproksymację indeksów CSWD, Jevonsa
Wnioski
Wnioski z przeprowadzonego badania analitycznego i empirycznego pozwalają rekomendować indeks YBMD jako bardzo dobrą alternatywę dla ugruntowanego indeksu Jevonsa. Rekomendacja ta oparta jest nie tylko na pożądanych własnościach aksjomatycznych indeksu YBMD, ale też na wspomnianych własnościach statystycznych (asymptotyczna nieobciążoność, relatywnie mała wariancja i MSE. Praktycznym wnioskiem z przeprowadzonych obserwacji jest również stwierdzenie, iż indeks YBMD – jako liniowa aproksymacja indeksu Jevonsa – jest potencjalnie mniej wrażliwy na występowanie skrajnie małych cen w porównaniu do indeksu Jevonsa (który ma postać iloczynu relatywnych cen).
Słowa kluczowe:
indeksy elementarne, indeks Jevonsa, indeks Dikhanova, indeks Younga-Balka-Mehrhoffa-Dikhanova, wskaźnik cen towarów i usług konsumpcyjnych (CPI)
Pobierz prezentację (docx, 18 kB)Objective
The aim of this presentation is to discuss the properties of the Young–Balk–Mehrhoff–Dikhanov (YBMD) elementary price index, which, on the one hand, is not well recognized in the literature, but on the other hand has the potential to serve as a very good alternative to the Jevons index recommended in CPI and HICP manuals. In particular, the purpose of the paper is to identify those situations in which the statistical properties of the YBMD index outperform the corresponding properties of the Jevons index.
Methods
The research methods used to achieve this objective are: (1) an analytical approach, consisting of formal mathematical proofs of selected properties of the YBMD index, and (2) an empirical study based on data collected by statistical office interviewers (data from 207 regions in Poland concerning sugar and bicycles), as well as on web-scraped data (prices of rice, yogurt, sugar, and coffee scraped from the website of a retail chain in Poland). Within the analytical approach, formulas for the bias, variance, and mean squared error (MSE) of the sample YBMD index were derived, and its properties were examined under the assumption of log-normal prices, taking into account the correlation between base-period and current-period prices. In the empirical study, in the case of data from survey regions, 207 price observations for each of the aforementioned products were used for each month covered by the study. In the case of scraped data, depending on the product, from several to several dozen observations were collected daily, depending on the number of available EAN codes for a given product on the website of the scraped retail chain. The empirical study did not attempt to generalize the findings from the samples: instead, the focus was on identifying the relationships between the values of sample elementary price indices, including the YBMD index.
Results
The results obtained in the study clearly indicate a number of advantages associated with the use of the YBMD index at the elementary level of CPI data aggregation. In particular, the main theoretical findings are as follows: (a) under log-normal prices, the sample YBMD index is an asymptotically unbiased estimator of the population YBMD index: (b) the bias and mean squared error (MSE) of the sample YBMD index depend significantly on the direction and strength of the correlation between base and current prices: (c) it is demonstrated that there exist sets of base and current prices for which the bias and MSE of the YBMD index are always smaller than the corresponding characteristics of the Jevons index. The empirical results, in turn, indicate a close approximation between the CSWD, Jevons
Conclusions
The conclusions drawn from the analytical and empirical study support recommending the YBMD index as a very good alternative to the well-established Jevons index. This recommendation is based not only on the desirable axiomatic properties of the YBMD index, but also on its statistical properties (asymptotic unbiasedness, relatively low variance, and MSE), which is a new result in the literature. A practical implication of the analysis is also that the YBMD index—as a linear approximation of the Jevons index—is potentially less sensitive to the presence of extremely low prices compared to the Jevons index (which takes the form of a product of price relatives).
Keywords
elementary indices, Jevons index, Dikhanov index, Young–Balk–Mehrhoff–Dikhanov index, Consumer Price Index (CPI)
Cel
Klasyfikacja COICOP (Classification of Individual Consumption According to Purpose) to międzynarodowy standard klasyfikacyjny opublikowany przez ONZ w 1999 roku. Stanowi jeden z kluczowych elementów współczesnej statystyki społeczno-gospodarczej, służący do grupowania wydatków konsumpcyjnych gospodarstw domowych według ich celu. Jej podstawowym zadaniem jest zapewnienie spójnego i porównywalnego opisu struktury konsumpcji w różnych obszarach statystyki, w szczególności w statystyce cen, rachunkach narodowych oraz badaniach budżetów gospodarstw domowych.
Metody
Pierwsza wersja klasyfikacji COICOP została wprowadzona we wczesnych latach `90 ( w 1993 roku) jako element ówczesnego systemu rachunków narodowych. Od początku jej konstrukcja opierała się na hierarchicznym podziale wydatków na działy, grupy i klasy, odpowiadające różnym kategoriom konsumpcji (np. żywność, transport, zdrowie). W kolejnych latach klasyfikacja była wykorzystywana coraz szerzej, stając się podstawą dla harmonizacji statystyki cen konsumpcyjnych, w tym wskaźników CPI i HICP. W odpowiedzi na zmiany zachodzące w strukturze konsumpcji oraz rozwój nowych form usług i produktów, klasyfikacja była stopniowo aktualizowana. Kluczowym etapem tej ewolucji było opracowanie nowej wersji – COICOP2018, przyjętej przez Komisję Statystyczną ONZ w 2018 r. W nowej klasyfikacji lepiej odzwierciedlono współczesne wzorce konsumpcji, uwzględniając m.in. rosnące znaczenie usług czy digitalizacji produktów. Wdrożenie klasyfikacji COICOP2018 w statystyce cen konsumpcyjnych stanowiło jedno z najważniejszych przedsięwzięć metodologicznych ostatnich lat. Zmiana ta, wprowadzana w Polsce od danych za 2026 r., wpisuje się w szerszy proces modernizacji statystyki publicznej na poziomie międzynarodowym.
Wyniki
Celem referatu jest przedstawienie wdrożenia COICOP2018 jako procesu systemowego, obejmującego zarówno aspekty metodologiczne, jak i organizacyjne oraz analityczne. Szczególny nacisk położony zostanie na konsekwencje tej zmiany dla badania cen detalicznych, które stanowi podstawowe źródło danych dla wskaźników CPI i HICP. Szczegółowo przeanalizowane zostaną wyzwania związane z zapewnieniem ciągłości i porównywalności szeregów czasowych. W referacie zostanie podjęty również temat wpływu zmian klasyfikacyjnych na strukturę wag oraz potencjalne implikacje dla poziomu i dynamiki wskaźników inflacji.
Wnioski
Wnioski z analizy wskazują, że wdrożenie COICOP2018 należy postrzegać nie tylko jako obowiązek wynikający z harmonizacji międzynarodowej, lecz także jako istotną szansę na modernizację statystyki cen. Zmiana ta sprzyja zwiększeniu reprezentatywności koszyka konsumpcyjnego, poprawie spójności międzydziedzinowej oraz lepszemu wykorzystaniu nowych źródeł danych. Referat wpisuje się w obszar „Badania statystyczne – metodologia i zastosowania”, prezentując wdrożenie klasyfikacji COICOP 2018 jako przykład złożonego procesu transformacji statystyki publicznej w odpowiedzi na zmieniające się warunki rynkowe oraz rosnące wymagania użytkowników danych.
Słowa kluczowe:
inflacja, wskaźniki cen, klasyfikacja COICOP
Pobierz prezentację (docx, 19 kB)Objective
The COICOP classification (Classification of Individual Consumption According to Purpose) is an international classification standard published by the United Nations in 1999. It constitutes one of the key elements of modern socio-economic statistics, used to group household consumption expenditures according to their purpose. Its primary function is to ensure a consistent and comparable description of the structure of consumption across different statistical domains, in particular price statistics, national accounts, and household budget surveys.
Methods
The first version of COICOP was introduced in the early 1990s (1993) as part of the System of National Accounts. From the outset, its structure was based on a hierarchical division of expenditures into divisions, groups, and classes corresponding to different consumption categories (e.g. food, transport, health). Over time, the classification has been increasingly widely applied, becoming a foundation for the harmonisation of consumer price statistics, including CPI and HICP indices. In response to changes in consumption patterns and the development of new types of goods and services, the classification has been progressively updated. A key milestone in this evolution was the development of a new version—COICOP2018—adopted by the United Nations Statistical Commission in 2018. The updated classification better reflects contemporary consumption patterns, including the growing importance of services and the digitalisation of products. The implementation of COICOP2018 in consumer price statistics has been one of the most significant methodological undertakings in recent years. In Poland, this change has been introduced starting with data for 2026 and forms part of a broader process of modernising official statistics at the international level.
Results
The aim of this paper is to present the implementation of COICOP2018 as a systemic process encompassing methodological, organisational, and analytical dimensions. Particular emphasis is placed on the implications of this change for retail price surveys, which constitute the primary data source for CPI and HICP indices. The paper provides a detailed analysis of the challenges related to ensuring the continuity and comparability of time series. The impact of classification changes on the weighting structure and the potential implications for the level and dynamics of inflation indices are also examined.
Conclusions
The findings indicate that the implementation of COICOP2018 should be seen not only as an obligation resulting from international harmonisation, but also as an important opportunity to modernise price statistics. The change contributes to improving the representativeness of the consumer basket, enhancing cross-domain consistency, and enabling better use of new data sources. The paper falls within the thematic area of “Statistical surveys – methodology and applications”, presenting the implementation of COICOP 2018 as an example of a complex transformation process in official statistics in response to changing market conditions and increasing user demands.
Keywords
inflation, price indices, COICOP classification
Cel
Celem badania jest prezentacja nowej metody – SDEA-INI (Spatial Data Envelopment Analysis with Independent Neighbours’ Inputs) integrującej interakcje przestrzenne jednocześnie eliminując ograniczenia dotyczące kontrolowalności nakładów przestrzennych w ramach analizy DEA. Zaproponowana metoda umożliwiła ocenę zróżnicowania regionalnego efektywności systemów ochrony zdrowia w Europie z uwzględnieniem zależności przestrzennych oraz egzogeniczności zasobów sąsiednich regionów.
Metody
W badaniu przedstawiono nowatorskie rozwiązanie oparte na metodzie DEA, które uwzględnia zarówno interakcje przestrzenne, jak i egzogeniczność nakładów. Poprzez zastosowanie modelu SDEA, w procesie optymalizacji wprost uwzględniamy autokorelację przestrzenną nakładów i wyników. Ponadto rozwijamy metodologię SDEA tak by, nowy model optymalizacyjny pozwalał na uwzględnienie tych zasobów sąsiednich lokalizacji, które pozostają poza kontrolą decydentów danego regionu. Argumentujemy, że pominięcie interakcji przestrzennych lub egzogeniczności nakładów sąsiedzkich w analizie produktywności może prowadzić do obciążenia wyników. Przeprowadzone symulacje Monte Carlo wskazują jednoznacznie, że przestrzenne modyfikacje DEA przewyższają podejście klasyczne w warunkach zależności przestrzennych, natomiast SDEA-INI osiąga najlepsze wyniki w sytuacji, gdy nakłady mają charakter niekontrolowalny. Zaproponowane podejście zastosowano do oceny efektywności systemów ochrony zdrowia dla danych z bazy Eurostat (232 europejskich regionów NUTS 2 dla lat 2011 i 2018). Nakładami są: liczba lekarzy i łóżek szpitalnych na 100 tys. mieszkańców oraz produkt krajowy brutto per capita jako aproksymacja nakładów finansowych. Wynikami są przekształcone wskaźniki przeżywalności oparte na danych o umieralności według grup chorób. W modelu uwzględniono macierz wag przestrzennych opartą na trzech najbliższych sąsiadach.
Wyniki
Uzyskane wyniki wskazują na istotne przestrzenne zróżnicowanie efektywności systemów ochrony zdrowia w Europie oraz wyraźny układ „nieefektywnego centrum” (m.in. Niemcy, Austria) i „efektywnej peryferii” (Europa Środkowo-Wschodnia i Południowa). Metoda SDEA-INI ujawnia większą zmienność wyników niż klasyczne SDEA, eliminując efekt wygładzania i lepiej odzwierciedlając rzeczywiste procesy. W porównaniu z DEA i SDEA uzyskano istotnie różne rankingi regionów. W celu oceny jakości wyników przeprowadzono analizę wrażliwości (macierzy wag i miar wydatków) i testy statystyczne (rang Spearmana, Wilcoxona, Dunna).
Wnioski
Uwzględnienie interakcji przestrzennych oraz niekontrolowalności zasobów sąsiednich regionów jest kluczowe dla rzetelnej oceny efektywności regionalnej. Zaproponowana metoda SDEA-INI stanowi istotny wkład w rozwój metod statystycznych i optymalizacyjnych, oferując bardziej elastyczne narzędzie analizy. Uzyskane wyniki mają znaczenie praktyczne dla polityki zdrowotnej, szczególnie w kontekście właściwej alokacji zasobów i współpracy międzyregionalnej. Opracowane narządzie może być wykorzystane również w innych obszarach badań regionalnych.
Słowa kluczowe:
efektywność regionalna: analiza przestrzenna: DEA: system ochrony zdrowia: SDEA-INI
Pobierz prezentację (docx, 24 kB)Objective
The aim of the study is to present a new method – SDEA-INI (Spatial Data Envelopment Analysis with Independent Neighbours’ Inputs) – which integrates spatial interactions while simultaneously removing the restrictive assumption of controllability of spatial inputs within the DEA framework. The proposed approach enables the assessment of regional disparities in healthcare system efficiency across Europe, accounting for both spatial dependence and the exogeneity of resources in neighbouring regions.
Methods
The study introduces a novel DEA-based solution that incorporates both spatial interactions and the exogeneity of inputs. By applying the SDEA framework, spatial autocorrelation of inputs and outputs is explicitly included in the optimisation process. Furthermore, the SDEA methodology is extended so that the new optimisation model accounts for resources located in neighbouring regions that remain beyond the control of local decision-makers. We argue that ignoring spatial interactions or the exogeneity of neighbouring inputs in productivity analysis may lead to biased results. Monte Carlo simulations clearly demonstrate that spatial extensions of DEA outperform the classical approach under spatial dependence, while SDEA-INI performs best when inputs are non-controllable. The proposed method is applied to evaluate healthcare system efficiency using Eurostat data for 232 European NUTS 2 regions for the years 2011 and 2018. Inputs include the number of doctors and hospital beds per 100,000 inhabitants, as well as GDP per capita as a proxy for financial resources. Outputs are transformed survival indicators based on mortality rates by disease groups. A spatial weights matrix based on the three nearest neighbours is incorporated into the model.
Results
The results reveal significant spatial disparities in healthcare system efficiency across Europe, with a clear pattern of an “inefficient core” (including Germany and Austria) and a more efficient periphery (Central, Eastern, and Southern Europe). The SDEA-INI method shows greater variability than standard SDEA, reducing the smoothing effect and better reflecting real-world processes. Substantial differences in regional rankings are observed when compared with DEA and SDEA. To assess result quality, sensitivity analysis (for spatial weight matrices and expenditure measures) and statistical tests (Spearman’s rank correlation, Wilcoxon test, and Dunn’s test) were conducted.
Conclusions
Accounting for spatial interactions and the non-controllability of neighbouring resources is essential for a reliable assessment of regional efficiency. The proposed SDEA-INI method contributes significantly to the development of statistical and optimisation techniques by offering a more flexible analytical tool. The findings have practical implications for healthcare policy, particularly in terms of efficient resource allocation and interregional cooperation. The proposed approach can also be applied in other areas of regional analysis.
Keywords
regional efficiency: spatial analysis: DEA: healthcare system: SDEA-INI
Cel
Ochrona poufności informacji pozyskanych w spisach powszechnych, a zwłaszcza w Narodowym Spisie Powszechnym Ludności i Mieszkań (NSP). Efektywne zastosowanie metod kontroli ujawniania danych (ang. Statistical Disclosure Control, SDC) stanowi kluczowy warunek osiągnięcia optymalnej równowagi pomiędzy minimalizacją ryzyka identyfikacji jednostek a maksymalizacją użyteczności udostępnianych danych dla ich odbiorców. W wystąpieniu zaprezentujemy wyniki zastosowania metod i narzędzi SDC do ochrony tajemnicy statystycznej w danych z NSP przeprowadzonego w 2021 r..
Metody
Jest to kontynuacja oraz rozszerzenie wykonanych i prezentowanych w ubiegłych latach prac w tej dziedzinie. Wówczas koncentrowano się na bardzo ograniczonych danych dla ludności rezydującej w układzie siatki kilometrowej. Obecnie zajmiemy się w tym kontekście informacjami o ludności według definicji krajowej w układzie oczek siatki kilometrowej w podziale na płeć, ekonomiczne grupy wieku i ze względu na zmienną binarną określającą status na rynku pracy, o ludności rezydującej według obwodów spisowych w podziale na płeć, ekonomiczne grupy wieku, 10–letnie grupy wieku i ze względu na zmienną binarną określającą status na rynku pracy oraz o ludności według definicji krajowej w układzie obwodów również w tymże podziale. Podstawowym narzędziem wykorzystanym w tych pracach była celowana wymiana rekordów (ang. Targeted Record Swapping, TRS), rekomendowana do stosowania przez Eurostat. TRS wymaga zdefiniowania m.in. hierarchii, zmiennych używanych do oceny podobieństwa wierszy, progu ryzyka, zmiennych używanych do estymacji ryzyka oraz wskaźnika zamian. Ponieważ jednak metoda TRS nie zapewnia w pełni wyeliminowania ryzyka identyfikacji pośredniej, dodatkowo użyto tutaj ukrywania niektórych danych, które na podstawie występujących powiązań mogłyby posłużyć do odtworzenia informacji wrażliwych. W niektórych przypadkach zastosowano mechanizm probabilistyczny (w niejednoznacznej sytuacji losowano komórkę do ukrycia z prawdopodobieństwem proporcjonalnym do jej udziału w wartości ogółem).
Wyniki
TRS polega na wykorzystaniu hierarchicznej struktury mikrodanych (zwłaszcza w kontekście geograficznym) i opiera się na określaniu grup rekordów o największym ryzyku ujawnienia na każdym poziomie hierarchii i wymianie danych z zakresu zmiennych definiujących określone poziomy dokonywanej między grupami rekordów najbliższymi według odległości wyznaczanej na podstawie wartości określonych zmiennych (tzw. zmiennych podobieństwa). Wymiana danych następuje tutaj pomiędzy jednostkami wyższego poziomu niż podstawowy. W wystąpieniu ukazane zostaną założenia zrealizowanych prac, użyte narzędzia informatyczne oraz efekty tychże działań. Omówiona będzie także ocena jakości uzyskanych rezultatów, zwłaszcza w kontekście wspomnianego wyżej balansu pomiędzy ochroną danych a ich użytecznością.
Wnioski
Uzyskane rezultaty, które zostaną zaprezentowane podczas wystąpienia, ukazują efektywność i praktyczną użyteczność zaproponowanego podejścia w zakresie skutecznej ochrony tajemnicy statystycznej przy maksymalizacji użyteczności udostępnianych danych. Zilustrowane to zostanie odpowiednimi wnioskami dotyczącymi ryzyka ujawnienia i straty informacji powstałej na skutek zastosowania metod kontroli ujawniania danych. Wskażemy także na możliwości wykorzystania rozpatrywanych rozwiązań do ochrony danych wynikowych w innych badaniach statystycznych.
Słowa kluczowe:
kontrola ujawniania danych, spisy powszechne, ludność rezydująca, ludność według definicji krajowej, celowana wymiana rekordów
Pobierz prezentację (docx, 19 kB)Objective
We aim to ensure the confidentiality of information collected in censuses, particularly the National Population and Housing Census (NSP). The effective application of Statistical Disclosure Control (SDC) methods is essential to achieve an optimal trade-off between minimizing the risk of unit identification and maximizing the utility of disclosed data for potential users. The purpose of the presentation is to report results of applying SDC methods and tools to data from the 2021 census.
Methods
It follows and extends the work conducted and presented in previous years. At that time, the focus was on very limited 1-km grid data about the resident population. This time, we will focus on 1-km grid population data according to the national definition, broken down by sex, economic age groups, and binary employment status: the resident population at the level of census districts, broken down by sex, economic age groups, 10-year age groups and binary employment status: and the population according to the national definition at the level of census districts, with the same breakdowns. The main SDC method used in the study was Targeted Record Swapping (TRS), recommended by Eurostat. TRS required to define e.g. a hierarchy within data, variables used to assess similarity between rows, risk threshold, variables used to risk estimation and expected swaprate. Since the TRS method does not completely eliminate the risk of indirect identification, especial probabilistic approach was also employed. It was used when several sensitive cells had minimum size: in that case the cell to be swapped was sampled with probability proportional to the share of such cell in relevant total in the population.
Results
TRS accounts for the hierarchical structure of microdata (especially their geographic dimension) and consists in identifying groups of records with the highest disclosure risk at each level of the hierarchy and swapping values for specific levels of variables within groups of similar records based on distances determined using the values of specific variables (known as similarity variables or matching keys). Values are swapped between units at a higher level. A summary of results will include an assessment of their quality, particularly from the perspective of the trade-off between data protection and utility.
Conclusions
The obtained results which will be presented, show effectiveness and practical utility of the proposed approach for efficient protection of statistical confidentiality with maximisation of utility of released data. It will be illustrated by relevant conclusions concerning the disclosure risk and information loss occuring as a result of application of statistical disclosure control methods. We will also mention potential applications of our SDC solutions to protect output data in other statistical surveys.
Keywords
statistical disclosure control, censuses, resident population, population according to the national definition, targeted record swapping
Cel
Celem referatu jest przedstawienie roli Systemu Metadanych Statystycznych (SMS) jako centralnej platformy zarządzania metadanymi w statystyce publicznej. SMS wspiera projektowanie struktur modeli metadanych, ich rozwój, gromadzenie, wersjonowanie oraz udostępnianie. Analiza obejmuje ocenę wpływu SMS na jakość, spójność i stabilność procesów statystycznych oraz jego znaczenie dla budowy nowoczesnej infrastruktury metainformacyjnej GUS.
Metody
SMS gromadzi metadane począwszy od 2013 roku. Metadane te przechowywane są w strukturach modeli metadanych, które były systematycznie dostosowywane do zmieniających się potrzeb użytkowników oraz systemów informatycznych funkcjonujących w GUS. Wystąpienie opiera się na analizie funkcjonalności SMS oraz dokumentacji opisującej mechanizmy, które przez lata kształtowały sposób pracy z metadanymi. Zastosowano przegląd funkcjonalny kluczowych mechanizmów SMS, takich jak workflow zatwierdzania metadanych, wielopoziomowy system uprawnień, eksport i import metadanych oraz integracja SMS z systemami statystyki publicznej. Oceniono również wykorzystanie metadanych w najważniejszych produktach informacyjnych statystyki publicznej, takich jak Dziedzinowe Bazy Wiedzy (DBW), System Monitorowania Usług Publicznych (SMUP), Bank Danych Lokalnych (BDL), Program badań statystycznych statystyki publicznej oraz Portal Informacyjny GUS. Uwzględniono także doświadczenia wynikające z wieloletniej eksploatacji systemu, obejmujące zarówno jego mocne strony, jak i ograniczenia technologiczne, które wpływają na efektywność zarządzania metadanymi i stanowią przesłankę do projektowania nowego Podsystemu Metadanych.
Wyniki
Analiza wykazała, że SMS skutecznie wspiera zarządzanie metadanymi w statystyce publicznej, zapewniając ich spójność, wersjonowanie i dostępność dla wielu systemów. Mechanizmy workflow i uprawnień umożliwiają kontrolę jakości i bezpieczeństwa metadanych. System wspiera integrację z platformami publikacyjnymi i analitycznymi, stabilizując procesy metainformacyjne i ograniczając ryzyko niespójności opisów. Jednocześnie narastające ograniczenia technologiczne — w tym niewystarczająca automatyzacja i przestarzała architektura — coraz silniej wpływają na możliwości dalszego rozwoju, wskazując na potrzebę modernizacji i przebudowy rozwiązania.
Wnioski
SMS odgrywa kluczową rolę w standaryzacji i zarządzaniu metadanymi w GUS, jednak dalszy rozwój wymaga nowoczesnej architektury oraz pełnej integracji z innymi podsystemami systemu metainformacji. Doświadczenia z wieloletniej eksploatacji SMS stały się fundamentem do zaprojektowania nowego Podsystemu Metadanych, który ma zapewnić wyższą wydajność, interoperacyjność i automatyzację procesów, a także lepszą ergonomię i spójne środowisko pracy z metadanymi. Wyniki podkreślają strategiczne znaczenie centralnej platformy metadanych dla jakości i wiarygodności statystyki publicznej.
Słowa kluczowe:
metadane: cykl życia metadanych: standaryzacja metadanych: SMS: integracja systemów
Pobierz prezentację (docx, 18 kB)Objective
The objective of the paper is to present the role of the Statistical Metadata System (SMS) as the central platform for managing metadata in official statistics. SMS supports the design of metadata model structures, their development, collection, versioning, and dissemination. The analysis examines the impact of SMS on the quality, consistency, and stability of statistical processes, as well as its importance for building a modern metainformation infrastructure within Statistics Poland.
Methods
SMS has been collecting metadata since 2013, storing them within metadata model structures that have been continuously adapted to evolving user needs and the requirements of IT systems operating in Statistics Poland. The paper is based on an analysis of SMS functionalities and documentation describing the mechanisms that have shaped metadata management practices over more than a decade. A functional review of key system components was conducted, including metadata approval workflows, a multi-level permissions model, metadata import and export, and the integration of SMS with statistical production systems. The study also examines how metadata are used in major statistical information products such as the Domain Knowledge Bases (DBW), the Public Services Monitoring System (SMUP), the Local Data Bank (BDL), the Programme of Statistical Surveys of Official Statistics, and the Statistics Poland Information Portal. In addition, the analysis incorporates insights from long-term system operation, highlighting both strengths and limitations related to performance, usability, and technological constraints. These observations provide a basis for identifying areas requiring modernization and for understanding how SMS has informed the design of the new Metadata Subsystem.
Results
The analysis confirms that SMS effectively supports metadata management by ensuring consistency, version control, and accessibility across multiple systems in official statistics. Workflow and permission mechanisms enable quality assurance and secure handling of metadata, while integration with publication and analytical platforms stabilizes metainformation processes and reduces the risk of inconsistencies. At the same time, growing technological constraints — including insufficient automation and an outdated architecture — increasingly limit the system’s development potential, highlighting the need for modernization and redesign.
Conclusions
SMS plays a key role in the standardization and management of metadata within Statistics Poland: however, further development requires a modern architecture and full integration with other components of the metainformation system. Experience gained from long-term operation of SMS has provided the foundation for designing the new Metadata Subsystem, intended to deliver higher performance, interoperability, process automation, and a more ergonomic and coherent working environment. The findings emphasize the strategic importance of a central metadata platform for the quality and reliability of official statistics.
Keywords
metadata: metadata lifecycle: metadata standardization: SMS: system integration
Cel
Celem prac było opisanie zmian metodologicznych i ich wpływu na pomiar aktywności zawodowej w Polsce. Analizowane są nieciągłości szeregów czasowych wynikające ze zmian definicji statusu na rynku pracy i schematu rotacji, przejścia na telefoniczny tryb zbierania danych oraz aktualizacji populacji referencyjnej po Narodowym Spisie Powszechnym 2021. Szczególną uwagę poświęcono konsekwencjom zmian wprowadzonych w latach 2020–2021, obejmujących zarówno skutki pandemii COVID-19, jak i harmonizację badań społecznych w Unii Europejskiej.
Metody
Analizy przeprowadzone zostały na podpróbach danych jednostkowych BAEL za lata 1995–2024. Zastosowano metody statystyki opisowej, regresję liniową i logistyczną, nieparametryczne modele klasyfikacji (algorytm random forest), post-stratyfikację oraz iteracyjne dopasowywanie proporcjonalne (IPF raking). .
Wyniki
Przedstawione zostały kluczowe czynniki wpływające na pomiar populacji i podstawowych wskaźników podaży pracy. ,
Wnioski
Badanie Aktywności Ekonomicznej Ludności (BAEL), pomimo zaburzeń pomiaru i ograniczonej porównywalności danych w czasie, pozostaje kluczowym źródłem informacji o wielkości i strukturze podaży pracy w Polsce. Jest wykorzystywany zarówno do szacowania najważniejszych wskaźników rynku pracy jak i analiz pogłębionych. Identyfikacja i kwantyfikacja efektów zmian metodologicznych jest niezbędna do prawidłowej interpretacji trendów na rynku pracy, zwłaszcza w okresach intensywnych zmian. Stosowanie zaawansowanych procedur ważenia może częściowo kompensować zaburzenia pomiaru.
Słowa kluczowe:
Badanie Aktywności Ekonomicznej Ludności, populacja, Narodowy Spis Powszechny, zmiany metodologiczne
Pobierz prezentację (docx, 18 kB)Objective
The aim of this work was to describe methodological changes and their impact on the measurement of labour market activity in Poland. The analysis covers discontinuities in time series arising from changes in the definitions of labour market status and the rotation scheme, the transition to computer-assisted telephone interviewing, and the update of the reference population following the 2021 National Census. Particular attention is paid to the consequences of changes introduced in 2020–2021, encompassing both the effects of the COVID-19 pandemic and the harmonisation of social surveys within t
Methods
The analyses were conducted on sub-samples of Polish LFS individual-level data for the years 1995–2024. The methods applied include descriptive statistics, linear and logistic regression, non-parametric classification models (random forest algorithm), post-stratification, and iterative proportional fitting (IPF raking). .
Results
The key factors affecting the measurement of the population and core labour supply indicators are presented. .
Conclusions
The Polish Labour Force Survey (PL-LFS), despite measurement disturbances and limited comparability of data over time, remains a key source of information on the size and structure of labour supply in Poland. It is used both for estimating the most important labour market indicators and for in-depth analyses. The identification and quantification of the effects of methodological changes are essential for the correct interpretation of labour market trends, particularly during periods of intensive change. The use of advanced weighting procedures can partially compensate for measurement disturbances.
Keywords
Polish Labour Force Survey, population, National Census, methodological changes
Cel
European Innovation Scoreboard to zestaw wskaźników innowacyjności krajów członkowskich Unii Europejskiej, a także niektórych innych krajów, publikowany od przeszło 20 lat przez Komisję Europejską. Na podstawie wskaźników tworzony jest ranking innowacyjności krajów UE. W referacie stawiamy tezę, że o ile EIS jest użyteczny jako baza danych służąca analizom komparatywnych wybranych funkcji systemu innowacji, o tyle niepoprawne jest wyciąganie wniosków z samego miejsca kraju w rankingu. W szczególności nie powinno się na tej podstawie oceniać skuteczności polityk innowacyjnych krajów UE.
Metody
Źródłem danych są szczegółowe rankingi European Innovation Scoreboard opublikowane od 2014 roku. Na podstawie tych danych, a także podstawowych danych o poziomie rozwoju społeczno-gospodarczego krajów przeprowadzamy szereg analiz celem ustalenia, jakie zmienne są dobrymi predyktorami miejsca kraju w EIS. Zaczynamy od prostej korelacji i korelacji rang, przechodząc następnie do technik-machine learning, w tym drzew decyzyjnych. Źródłem danych są szczegółowe rankingi European Innovation Scoreboard opublikowane od 2014 roku. Na podstawie tych danych, a także podstawowych danych o poziomie rozwoju społeczno-gospodarczego krajów przeprowadzamy szereg analiz celem ustalenia, jakie zmienne są dobrymi predyktorami miejsca kraju w EIS. Zaczynamy od prostej korelacji i korelacji rang, przechodząc następnie do technik-machine learning, w tym drzew decyzyjnych. Źródłem danych są szczegółowe rankingi European Innovation Scoreboard opublikowane od 2014 roku. Na podstawie tych danych, a także podstawowych danych o poziomie rozwoju społeczno-gospodarczego krajów przeprowadzamy szereg analiz celem ustalenia, jakie zmienne są dobrymi predyktorami miejsca kraju w EIS. Zaczynamy od prostej korelacji i korelacji rang, przechodząc następnie do technik-machine learning, w tym drzew decyzyjnych.
Wyniki
Wyniki wskazują, że miejsce kraju w European Innovation Scoreboard jest w znacznym stopniu wyjaśniona przez ograniczony zestaw zmiennych, w tym PKB per capita i całkowite wydatki na B+R jako odsetek PKB. Ranking wykazuje też znaczną stabilność w czasie. Wyniki wskazują, że miejsce kraju w European Innovation Scoreboard jest w znacznym stopniu wyjaśniona przez ograniczony zestaw zmiennych, w tym PKB per capita i całkowite wydatki na B+R jako odsetek PKB. Ranking wykazuje też znaczną stabilność w czasie. Wyniki wskazują, że miejsce kraju w European Innovation Scoreboard jest w znacznym stopniu wyjaśniona przez ograniczony zestaw zmiennych, w tym PKB per capita i całkowite wydatki na B+R jako odsetek PKB. Ranking wykazuje też znaczną stabilność w czasie.
Wnioski
W dyskusjach publicznych spotkać się można z opiniami, że skoro Polska zajmuje odległe miejsce w rankingu European Innovation Scoreboard, to świadczy to o nieskuteczności polityki innowacyjnej, w szczególności finansowego wsparcia dla działalności innowacyjnej firm i ulg podatkowych. Na podstawie uzyskanych wyników można postawić stwierdzić, że takie rozumowanie jest niepoprawne. Ignoruje ono bowiem, po pierwsze, postępy czynione przez inne kraje, a po drugie szersze tło procesów konwergencji, silnie wpływających na miejsce Polski w rankingu.
Słowa kluczowe:
European Innovation Scoreboard, innowacyjność, ranking międzynarodowy, machine-learning
Pobierz prezentację (pdf, 257 kB)Objective
The European Innovation Scoreboard is a set of indicators measuring the innovation performance of the member states of the European Union, as well as some other countries, published for over 20 years by the European Commission. Based on these indicators, a ranking of EU countries is created. In this paper, we argue that while the EIS is useful as a database for comparative analyses of selected functions of innovation systems, it is not appropriate to draw conclusions solely from a country’s position in the ranking. In particular, it should not be used as an innovation policy evaluation tool.
Methods
The data source consists of detailed rankings from the European Innovation Scoreboard published since 2014. Based on these data, as well as basic data on countries’ levels of socio-economic development, we conduct a series of analyses to determine which variables are good predictors of a country’s position in the EIS. We begin with simple correlation and rank correlation, and then move on to machine learning techniques, including decision trees. The data source consists of detailed rankings from the European Innovation Scoreboard published since 2014. Based on these data, as well as basic data on countries’ levels of socio-economic development, we conduct a series of analyses to determine which variables are good predictors of a country’s position in the EIS. We begin with simple correlation and rank correlation, and then move on to machine learning techniques, including decision trees. The data source consists of detailed rankings from the European Innovation Scoreboard published since 2014. Based on these data, as well as basic data on countries’ levels of socio-economic development, we conduct a series of analyses to determine which variables are good predictors of a country’s position in the EIS. We begin with simple correlation and rank correlation, and then move on to machine learning techniques, including decision trees.
Results
The results indicate that a country’s position in the European Innovation Scoreboard is largely explained by a limited set of variables, including GDP per capita and total R*D expenditure as a percentage of GDP (i.e., GERD). The ranking also exhibits considerable stability over time. The results indicate that a country’s position in the European Innovation Scoreboard is largely explained by a limited set of variables, including GDP per capita and total R*D expenditure as a percentage of GDP (i.e., GERD). The ranking also exhibits considerable stability over time. The results indicate that a country’s position in the European Innovation Scoreboard is largely explained by a limited set of variables, including GDP per capita and total R*D expenditure as a percentage of GDP (i.e., GERD). The
Conclusions
In public debates, one can encounter opinions that Poland’s relatively low position in the European Innovation Scoreboard indicates the ineffectiveness of innovation policy, particularly financial support for firms’ innovation activities and tax incentives. Based on the obtained results, it can be argued that such reasoning is incorrect for at least two reasons. First, it ignores the efforts by other countries, and secondly, it ignores deeper convergence process that co-determine international country rankings.
Keywords
European Innovation Scoreboard, innovation, international rankings, machine-learning
-
Cel
Referat wpisuje się w jeden z obszarów tematycznych VI Kongresu Statystyki Polskiej - Historia, edukacja i promocja statystyki. Celem prezentacji jest przedstawienie postaci i dorobku naukowego Stefana Szulca, jednego z zasłużonych polskich statystyków i demografów, którego prace odegrały istotną rolę i spotkały się z uznaniem w Polsce i na świecie. Profesor Szulc, wybitny naukowiec, pedagog, prezes Głównego Urzędu Statystycznego jest patronem Centralnej Biblioteki Statystycznej, która w 2026 r. upamiętnia w różnej formie pamięć Profesora przypominając jego dokonania w 70 lecie jego śmierci.
Metody
Stefan Szulc pozostawił po sobie bogaty dorobek naukowy a także dokumentację archiwalna dotyczącą jego pracy jako naukowca i urzędnika. W Archiwum GUS znajdują się akta osobowe S. Szulca, archiwum Polskiej Akademii Nauk posiada dokumentację dotyczącą działalności naukowej i nieopublikowane teksty jego autorstwa. W zbiorach Centralnej Biblioteki Statystycznej znajdują się wszystkie opublikowane prace książkowe oraz artykuły w czasopismach naukowych. W 1978 r. CBS wydała bibliografię prac profesora, której uaktualnione wydanie planowane jest w r. 2026. Materiały te na przestrzeni lat były źródłem danych do opracowań na temat dokonań S. Szulca publikowanych w wydawnictwach biograficznych dotyczących świata nauki polskiej, publikacjach historycznych wydawanych przez Główny Urząd Statystyczny oraz czasopismach naukowych z dziedziny statystyki i bibliotekoznawstwa, które również są dostępne w zbiorach CBS. Na podstawie tych źródeł informacji przedstawiciele Centralnej Biblioteki Statystycznej chcieliby zaprezentować postać i dokonania profesora jako ważnej postaci w historii statystyki polskiej – jednego z współtwórców polskiej statystyki publicznej, autora i redaktora ważnych publikacji statystycznych, wykładowcy i wychowawcy wielu polskich statystyków, autora publikacji dydaktycznych z dziedziny statystyki, organizatora biblioteki GUS oraz pierwszego powojennego prezesa Głównego Urzędu Statystycznego. Referat wraz z prezentacją pokaże wpływ Stefana Szulca na polską statystykę.
Wyniki
Referat prezentuje drogę naukową i zawodową S. Szulca: - działalność publikacyjną i tłumaczeniową rozpoczętą już w trakcie studiów, - pracę w Głównym Urzędzie Statystycznym, rozpoczętą w 1919 r., początkowo na stanowisku referenta, potem pierwszego kierownika Biblioteki GUS, a następnie naczelnika Wydziału Wydawnictw i Pomocy Naukowych, Wydziału Statystyki Ludności i Głównego Redaktora wydawnictw GUS, - zapoczątkowanie i organizację wydawania kluczowych serii i kontynuowanych do dziś publikacji GUS, m.in. roczników statystycznych RP, - dokonania w roli wieloletniego wykładowcy uniwersyteckiego, - wpływ na polską statystykę, jako autora wznawianych wielokrotnie podręczników na którym wychowały się pokolenia polskich studentów.
Wnioski
Stefan Szulc był jednym z głównych współtwórców i organizatorów GUS i systemu statystycznego w Polsce, wnosząc swój wkład do dorobku tematycznego, organizacyjnego i publikacyjnego polskiej statystyki. W ciągu pięćdziesięciu lat twórczej pracy opublikował 74 naukowe prace autorskie, jeden przekład oraz kilkadziesiąt publikacji statystycznych GUS, których był Redaktorem Głównym. Podręcznik jego autorstwa „Metody statystyczne” do dziś jest wykorzystywany w nauczaniu statystyki. 70 rocznica śmierci profesora Szulca jest niepowtarzalną okazją do przypomnienia dokonań tego wybitnego statystyka i patrona Centralnej Biblioteki Statystycznej na forum VI Kongresu Statystyki Polskiej.
Słowa kluczowe:
historia statystyki : demografia historyczna : biogram statystyka
Pobierz prezentację (docx, 22 kB)Objective
The paper falls under the thematic area: History, education and dissemination of statistics. The aim is to introduce the figure and scientific achievements of Stefan Szulc, one of the distinguished Polish statisticians and demographers whose work played a significant role and gained recognition both in Poland and internationally. Professor Szulc, an outstanding scholar, educator, and President of the Central Statistical Office, is the patron of the Central Statistical Library, which in 2026 commemorates him in various ways by recalling his achievements on the 70th anniversary of his death.
Methods
Stefan Szulc left behind a rich body of scientific work as well as archival documentation related to his activities as a scholar and public official. The Archives of the Central Statistical Office hold his personal records, while the archives of the Polish Academy of Sciences contain documentation of his scientific activity and unpublished texts authored by him. The collections of the Central Statistical Library include all of his published books and articles in academic journals. In 1978, the Library published a bibliography of the Professor’s works, an updated edition is planned for 2026. Over the years, these materials have served as sources for studies on Szulc’s achievements, published in biographical works on the Polish scientific community, historical publications issued by the Central Statistical Office, and academic journals in the fields of statistics and library science, all of which are also available in the Library’s collections. Based on these sources, representatives of the Central Statistical Library aim to present the figure and accomplishments of the Professor as an important figure in the history of Polish statistics - one of the co-creators of Polish official statistics, an author and editor of significant statistical publications, a lecturer and mentor to many Polish statisticians, an author of educational publications in statistics, the organizer of the Central Statistical Office’s library, and the first post-war President of the CSO.
Results
The paper presents the academic and professional trajectory of Stefan Szulc, including: - his publishing and translation activities, - his work at the Central Statistical Office, which started in 1919 - initially as a junior officer, then as the first head of the CSO Library, followed by positions as head of the Publications and Scientific Resources Division, the Population Statistics Division, and Editor-in-Chief of CSO publications, - the initiation and organization of key publication series of the CSO that continue to this day, including the Statistical Yearbooks of the Republic of Poland, - his achievements as a long-standing university lecturer, - his impact on Polish statistics as the author of repeatedly reissued textbooks on which generations of Polish students were educated.
Conclusions
Stefan Szulc was one of the main co-creators and organizers of the statistical system in Poland, contributing to the thematic, organizational, and publishing achievements of Polish statistics. Over more than fifty years of scholarly work, he published 74 original scientific papers, one translation, and several dozen statistical publications of the Central Statistical Office, for which he served as Editor-in-Chief. His textbook Statistical Methods is still used in the teaching of statistics today. The 70th anniversary of Professor Szulc’s death provides a unique opportunity to recall the achievements of this outstanding statistician at the forum of the 6th Congress of Polish Statistics.
Keywords
history of statistics : historical demography : statistician`s biography
Cel
Celem wystąpienia jest przedstawienie nowoczesnych form popularyzacji statystyki publicznej i upowszechniania wiedzy o danych oraz pokazanie, w jaki sposób współczesne narzędzia komunikacji mogą zwiększać dostępność informacji statystycznych, wspierać skuteczniejsze docieranie do różnych grup odbiorców, wzmacniać społeczne zainteresowanie danymi i ich praktycznym znaczeniem w codziennej praktyce. Celem wystąpienia jest przedstawienie nowoczesnych form popularyzacji statystyki
Metody
W wystąpieniu zaprezentowane zostaną przykłady działań komunikacyjnych i popularyzatorskich wykorzystujących formaty audio i wideo, webinary, inicjatywy edukacyjne oraz inne rozwiązania wspierające budowanie zainteresowania statystyką. Omówione zostaną podcasty przygotowywane w Urzędzie, podcasty tworzone zewnętrznie na potrzeby promocji badań ankietowych, krótkie formy wideo publikowane w mediach społecznościowych, a także webinary służące prostemu i przystępnemu objaśnianiu danych statystycznych. Przedstawione będą również przykłady nowoczesnych praktyk dla studentów, działań angażujących młodych odbiorców w rozmowę o znaczeniu danych oraz gier analitycznych pokazujących praktyczne zastosowanie statystyki w różnych środowiskach. Punktem odniesienia będzie obserwacja zmian w sposobach komunikowania informacji statystycznych oraz dostosowywania języka, formy i kanałów przekazu do potrzeb współczesnych odbiorców. Zastosowane podejście ma charakter przeglądowy i opiera się na analizie przykładów własnych działań informacyjnych, edukacyjnych i promocyjnych realizowanych z wykorzystaniem nowoczesnych narzędzi komunikacji. Uwzględniona będzie również ich funkcja edukacyjna i promocyjna.
Wyniki
Przedstawione działania pokazują, że o danych i statystyce publicznej można mówić w sposób przystępny, angażujący i dostosowany do potrzeb współczesnego odbiorcy. Nowoczesne formy przekazu zwiększają atrakcyjność treści statystycznych, ułatwiają ich odbiór oraz sprzyjają większemu zainteresowaniu tematyką danych, badaniami statystycznymi i rolą statystyki publicznej. Wykorzystanie podcastów, webinarów, krótkich form wideo i działań edukacyjnych wspiera budowanie relacji z odbiorcami oraz wzmacnia obecność statystyki w przestrzeni społecznej i informacyjnej. Zwiększa też ich zaufanie społeczne.
Wnioski
Nowoczesne kanały komunikacji mogą skutecznie wzmacniać wizerunek statystyki publicznej, rozwijać dialog ze społeczeństwem oraz budować większą świadomość znaczenia danych w życiu społecznym i gospodarczym. Różnorodność form przekazu sprzyja lepszemu dopasowaniu komunikacji do potrzeb różnych grup odbiorców, a także zwiększa szanse na trwałe zainteresowanie statystyką i jej praktycznym wykorzystaniem w codziennym podejmowaniu decyzji oraz świadomym odbiorze informacji w różnych obszarach życia.
Słowa kluczowe:
statystyka publiczna, popularyzacja statystyki, komunikacja danych, podcasty, webinary, edukacja statystyczna
Pobierz prezentację (docx, 30 kB)Objective
The aim of the presentation is to present modern approaches to promoting official statistics and disseminating knowledge about data, and to show how modern communication tools can increase access to statistical information, improve outreach to diverse key target groups, and strengthen public interest in data and its practical importance in everyday life, public life, and decision-making processes.
Methods
The presentation will showcase examples of communication and outreach activities using audio and video formats, webinars, educational initiatives, and other solutions supporting greater interest in statistics. It will discuss podcasts produced within the Office, externally created podcasts promoting survey research, short video formats published on social media, as well as webinars aimed at explaining statistical data in a simple and accessible way. Examples of modern internship programmes for students, activities engaging young audiences in discussions on the importance of data, and analytical games demonstrating the practical use of statistics in different environments will also be presented. The main point of reference will be the observation of changes in the ways statistical information is communicated and in the adaptation of language, format, and communication channels to the needs of contemporary audiences. The approach is of a review nature and is based on the analysis of examples drawn from information, educational, and promotional activities carried out with the use of modern communication tools. Their educational and promotional function will also be taken into account.
Results
The presented activities show that data and official statistics can be communicated in a way that is accessible, engaging, and tailored to the needs of contemporary audiences. Modern forms of communication increase the attractiveness of statistical content, facilitate its reception, and encourage greater interest in data, statistical surveys, and the role of official statistics. The use of podcasts, webinars, short video formats, and educational activities supports relationship-building with audiences and strengthens the presence of statistics in the social and information space. It also enhances public trust.
Conclusions
Modern communication channels can effectively strengthen the image of official statistics, foster dialogue with society, and build greater awareness of the importance of data in social and economic life. The diversity of communication formats supports better adaptation of messages to the needs of different target groups and increases the chances of sustaining interest in statistics and its practical use in everyday decision-making and in the informed interpretation of information across various areas of life.
Keywords
official statistics, data communication, podcasts, webinars, statistical education, modern
Cel
Celem badania jest identyfikacja minimalnej skali bezdomności oraz estymacja natężenia śmiertelności w tej populacji na podstawie dostępnych źródeł administracyjnych. Zjawisko to jest rejestrowane w ograniczonym stopniu w systemach statystycznych, co utrudnia jego pełne uchwycenie i monitorowanie. Szczególną uwagę poświęcono identyfikacji zgonów osób w kryzysie bezdomności oraz analizie ich ryzyka zgonu względem populacji ogólnej.
Metody
W badaniu wykorzystano zintegrowane podejście oparte na trzech źródłach danych administracyjnych: (1) zbiorze osób korzystających z pomocy społecznej, którym zapewniono pochówek na koszt gminy, (2) rozszerzonym zbiorze beneficjentów pomocy społecznej, w którym oszacowano liczbę zgonów wśród osób, które przestały korzystać ze świadczeń, oraz (3) zbiorze danych o pochówkach realizowanych przez gminy. Kluczowym elementem analizy było zastosowanie autorskich algorytmów umożliwiających identyfikację osób w kryzysie bezdomności poprzez rekonstrukcję numerów PESEL oraz łączenie danych z różnych rejestrów administracyjnych. W przypadku braków identyfikatorów osobowych zastosowano podejścia estymacyjne pozwalające określić najbardziej prawdopodobną wartość oczekiwaną liczby zgonów wśród osób, które znikają z systemu pomocy społecznej. W procesie łączenia zbiorów zastosowano podejście deterministyczne, oparte na dostępnych identyfikatorach oraz wybranych cechach opisowych, co umożliwiło bardziej precyzyjne dopasowanie rekordów i ograniczenie ryzyka wielokrotnego zliczania tych samych osób. Dokonano obliczeń surowych współczynników zgonów (CMR) oraz standaryzowanych współczynników umieralności (SMR), umożliwiających porównania międzynarodowe.
Wyniki
Zidentyfikowano około 1200 zgonów rocznie wśród osób w kryzysie bezdomności korzystających z pomocy społecznej w ciągu 12 miesięcy przed zgonem. Średni wiek zgonu w 2022 r. wyniósł 58,1 lata (SD=11,9), co wskazuje na wcześniejszą umieralność niż w populacji ogólnej. Surowy współczynnik zgonów wyniósł 3,76, a standaryzowany SMR=3,69, przy najwyższych wartościach dla osób poniżej 50 lat. Analiza przestrzenna wykazała istotne zróżnicowanie – Gminy miejskie odnotowują około czterokrotnie więcej pochówków komunalnych osób w kryzysie bezdomności per capita niż wiejskie. Wyniki stanowią dolne oszacowanie skali zjawiska.
Wnioski
Dostępne źródła administracyjne umożliwiają identyfikację minimalnej skali bezdomności oraz śmiertelności w tej populacji, jednak nie pozwalają na pełne oszacowanie jej rzeczywistego rozmiaru. Brak systematycznej rejestracji bezdomności oraz ograniczona dostępność identyfikatorów osobowych (np. PESEL) znacząco utrudniają łączenie danych i prowadzenie analiz. Uzyskane wyniki wskazują na ponad trzykrotnie wyższe ryzyko zgonu wśród osób w kryzysie bezdomności w porównaniu z populacją ogólną, szczególnie w młodszych grupach wieku. Podobne wartości uzyskuje się w badaniach w innych krajach.
Słowa kluczowe:
bezdomność: śmiertelność: dane administracyjne: SMR: pomoc społeczna
Pobierz prezentację (docx, 16 kB)Objective
The aim of the study is to identify the minimum scale of homelessness and to estimate the volume of mortality intensity in this population based on available administrative data sources. This phenomenon is only partially recorded in statistical systems, which makes it difficult to fully capture and monitor it. Particular attention is given to identifying deaths among people experiencing homelessness and analyzing their mortality risk in relation to the general population.
Methods
The study employs an integrated approach based on three administrative data sources: (1) a dataset of social assistance beneficiaries for whom burial was provided at municipal cost, (2) an extended dataset of social assistance beneficiaries in which the number of deaths was estimated among individuals who ceased receiving benefits, and (3) a dataset of burials held by local government. A key element of the analysis was the use of proprietary algorithms enabling the identification of persons experiencing homelessness through the reconstruction of personal identification numbers (PESEL) and linkage of data across administrative registers. In cases of missing personal identification numbers, estimation approaches were applied to determine the most likely expected number of deaths in the group of individuals who disappear from the social assistance system. In the process of combining the sets, a deterministic approach was used, based on available identifiers and selected descriptive features, which enabled more precise matching of records and reduced the risk of counting the same persons multiple times. Crude mortality rates (CMR) and standardized mortality ratios (SMR) were calculated to enable international comparisons.
Results
Approximately 1,200 deaths per year were identified among persons experiencing homelessness who had received social assistance within the 12 months preceding their death. The average age of death in 2022 was 58.1 years (SD = 11.9), indicating earlier mortality compared to the general population. The crude mortality rate was 3.76, and the standardized SMR was 3.69, with the highest values observed among individuals under 50 years of age. Spatial analysis revealed significant variation—urban municipalities record approximately four times more municipal burials of people experiencing homelessness per capita than rural municipalities. These results represent a lower-bound estimate of the phenomenon.
Conclusions
Available administrative data sources allow to identify the minimum scale of homelessness and mortality in this population but do not enable for a full estimation of its true magnitude. The lack of systematic registration of homelessness and limited availability of personal identification numbers (e.g., PESEL) significantly hinder data linkage and analysis. The findings indicate more than a threefold higher risk of death among persons experiencing homelessness compared to the general population, particularly in younger age groups. Similar values have been reported in the studies conducted in other countries.
Keywords
homelessness: mortality: administrative data: SMR: social assistance
Cel
Celem referatu jest przedstawienie nowego narzędzia statystyki publicznej prezentującego dane dotyczące osób niepełnosprawnych prawnie w Polsce. Dashboard został opracowany we współpracy z przedstawicielami Biura Pełnomocnika Rządu do Spraw Osób Niepełnosprawnych w Ministerstwie Rodziny, Pracy i Polityki Społecznej. Dane udostępniane w dashboardzie pochodzą z badania statystyki publicznej „Osoby niepełnosprawne prawnie”, które również zostanie omówione w referacie.
Metody
Badanie osób niepełnosprawnych prawnie jest realizowane cyklicznie raz w roku przez Urząd Statystyczny w Krakowie w oparciu o zintegrowane dane z rejestrów i systemów administracyjnych. W ramach tego badania zostały połączone dane z pięciu systemów orzeczniczych w Polsce: Elektronicznego Krajowego Systemu Monitoringu Orzekania o Niepełnosprawności, Systemów emerytalno-rentowych EMIR i RENTIER Zakładu Ubezpieczeń Społecznych, Systemu kompleksowej obsługi świadczeń emerytalno-rentowych Kasy Rolniczego Ubezpieczenia Społecznego, Zakładu Emerytalno-Rentowego Ministerstwa Spraw Wewnętrznych i Administracji oraz Systemu informacyjnego Ministerstwa Obrony Narodowej. Jest to badanie obejmujące całą populację osób niepełnosprawnych prawnie w Polsce, czyli osób posiadających aktualne orzeczenie, wydane przez Zespół do spraw orzekania o niepełnosprawności (o niepełnosprawności albo o stopniu niepełnosprawności) lub orzeczenie równoważne, wydane przez ZUS (o stopniu niezdolności do pracy), KRUS (o niezdolności do pracy w gospodarstwie rolnym), MSWiA i MON (o grupie inwalidztwa do 31 grudnia 1997 r.). W badaniu, jako źródło pomocnicze, są wykorzystywane dane Rejestru stanu cywilnego z systemów informacyjnych Ministerstwa Cyfryzacji (o osobach zmarłych) służące do aktualizacji zbioru.
Wyniki
W referacie zostaną omówione wynikowe informacje statystyczne o osobach niepełnosprawnych prawnie udostępnione w dashboardzie m. in. w podziałach według miejsca zamieszkania, płci, grup wieku, stopnia niepełnosprawności i występujących schorzeń. Zostaną przedstawione opcje filtrowania treści, przykładowe grafiki w formie animacji, wykresów i map, dopasowanie widoku do potrzeb użytkowników oraz dostępność cyfrowa. Ponadto zostaną przedstawione inne publikacje prezentujące wyniki z badania. Są to informacje sygnalne i infografiki. Część danych jest dostępna na mapach i wykresach w Portalu Geostatystycznym GUS.
Wnioski
Dashboard to praktyczne narzędzie nie tylko dla decydentów, administracji publicznej, analityków, naukowców, dziennikarzy, członków organizacji pozarządowych i przedsiębiorców, a także dla wszystkich zainteresowanych problemami około 4 milionów osób niepełnosprawnych prawnie w Polsce. Dane dostępne w formie interaktywnych map i wykresów oraz w gotowych plikach możliwych do pobrania mogą być wykorzystane przez jednostki samorządu terytorialnego na przykład do diagnozy potrzeb regionu czy w celu planowania odpowiedniego wsparcia osób niepełnosprawnych, również seniorów, np. w ramach programów asystencji osobistej lub świadczeń wspierających.
Słowa kluczowe:
niepełnosprawność, orzecznictwo
Pobierz prezentację (docx, 21 kB)Objective
The objective of the paper is to present a new public statistics tool that produces the data on legally disabled people in Poland. The dashboard has been developed in collaboration with representatives of the Office of the Government Plenipotentiary for Disabled Persons at the Ministry of Family, Labour and Social Policy. The data recorded in the dashboard derived from the public statistics research “Legally Disabled People”, which is also discussed in the paper.
Methods
The research on legally disabled people is carried out annually, on a regular basis, by the Statistical Office in Kraków, with the use of the integrated data deriving from the registers and the administrative systems.Within the research, the data from five disability certification systems in Poland have been interconnected: the Electronic National System for Monitoring Disability Certification, the old pension and disability pension systems of the Social Insurance Institution (ZUS), the comprehensive pension benefits service system of the Agricultural Social Insurance Fund (KRUS), the Pension Office of the Ministry of the interior and Administration and the Information System of the Ministry of National Defence. The research covers the entire population of legally disabled people in Poland, which is related to the persons holding valid certificate issued by the Disability Assessment Board (regarding disability or level of disability) or equal certificate issued by Social Insurance Institution (referring to the level of incapacity for work), KRUS (regarding incapacity for work in the agricultural farm), the Ministry of the Interior and Administration and the Ministry of National Defence (on the level of disability, issued before 12 / 31 / 1997). In the research the auxiliary data source from the Civil Register recorded in the information systems of the Ministry of Digitalisation (on deceased persons) was used as a supplementary information to update the dataset.
Results
The paper deals with the resulting statistical information on legally disabled people visualised in the dashboard, broken down by place of residence, sex, age groups, level of disability and medical conditions. The options for filtering content, sample animated graphics, charts and maps, customising the view to users’ needs, and digital access are going to be presented. In addition, other publications including the results of the research will be discussed. They refer to release news and infographics. Some of the data are available on maps and charts in the Geostatistical Portal of Statistics Poland.
Conclusions
The dashboard is a practical instrument designed not only for decision-makers, public administration, analysts, researchers, journalists, members of non-government organisations and businessmen, but also for everyone interested in the issues affecting about four million legally disabled people in Poland. The data, available in the form of interactive maps and charts as well as in ready-to-download files, can be used by local government bodies, for example, in order to diagnose the regional needs or for the purpose of planning appropriate support for disabled people, including elders, e.g. within the framework of individual assistance programmes or supporting benefits.
Keywords
disability, disability certification
Lista patronów
Patronat honorowy:
Patroni medialni:
