{"id":13946,"date":"2026-03-24T12:14:57","date_gmt":"2026-03-24T11:14:57","guid":{"rendered":"https:\/\/infoshareacademy.com\/blog\/?p=13946"},"modified":"2026-03-24T12:18:50","modified_gmt":"2026-03-24T11:18:50","slug":"warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle","status":"publish","type":"post","link":"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/","title":{"rendered":"Warsztat Data Engineera &#8211; kiedy wybra\u0107 CSV, parquet, feather albo pickle?"},"content":{"rendered":"\n<p>Praca z danymi to codzienno\u015b\u0107 w \u015bwiecie Data. Niezale\u017cnie od tego, czy budujemy pipeline ETL, analizujemy dane w Jupyter notebooku, lub zapisujemy wyniki modelu ML &#8211; dane wyj\u015bciowe b\u0119d\u0105 zapisane w jednym z kilku popularnych format\u00f3w. Chocia\u017c zapis danych do pliku to tylko jedna linijka kodu, odpowiedni format wp\u0142ywa na czytelno\u015b\u0107, rozmiar oraz czas zapisu i odczytu.<\/p>\n\n\n\n<p>\u017beby nie operowa\u0107 na abstrakcyjnych przyk\u0142adach, za\u0142\u00f3\u017cmy \u017ce pracujemy na konkretnym zbiorze danych &#8211; niech b\u0119dzie nim DataFrame z 10 000 000 rekord\u00f3w. Wygenerujemy go sami, aby symulowa\u0142 realistyczny plik.&nbsp;<em>Warto zaznaczy\u0107, \u017ce wszystkie czasy odczytu i zapisu podane w tym artykule maj\u0105 charakter pogl\u0105dowy \u2013 b\u0119d\u0105 si\u0119 one r\u00f3\u017cni\u0107 w zale\u017cno\u015bci od specyfikacji sprz\u0119towej komputera.<\/em><\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>import pandas as pd\nimport numpy as np\n\nn = 10000000\n\ndf = pd.DataFrame({\n    'id': np.arange(n),\n    'wiek': np.random.randint(18, 80, size=n),\n    'miasto': np.random.choice(&#91;'Warszawa', 'Krak\u00f3w', '\u0141\u00f3d\u017a', 'Siedlce'], size=n),\n    'zarobki': np.random.normal(7000, 1500, size=n).round(2),\n    'aktywny': np.random.choice(&#91;True, False], size=n)\n})\n<\/code><\/pre>\n\n\n\n<p>Por\u00f3wnuj\u0105c wydajno\u015b\u0107 zmierzymy czasy odczytu i zapisu, aby to zrobi\u0107 wykorzystamy bibliotek\u0119&nbsp;<code>time<\/code>. Dodamy linijk\u0119 b\u0119d\u0105c\u0105 naszym startem mierzenia czasu, potem wykonamy operacj\u0119 odczytu\/zapisu, a tu\u017c po niej dodamy linijk\u0119 odczytuj\u0105c\u0105 czas po raz drugi. Dostaniemy wtedy informacj\u0119 w sekundach, np. dla zapisu pliku w CSV b\u0119dzie to wygl\u0105da\u0107 tak:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>import time\n\nstart = time.time()\ndf.to_csv('dane.csv', index=False)\nprint('CSV zapis: ', time.time() - start)\n<\/code><\/pre>\n\n\n\n<h3 class=\"wp-block-heading\">CSV &#8211; prostota kosztem wydajno\u015bci<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Czas zapisu:<\/strong>\u00a09,2073 s<\/li>\n\n\n\n<li><strong>Czas odczytu:<\/strong>\u00a02,5402 s<\/li>\n\n\n\n<li><strong>Rozmiar pliku na dysku:<\/strong>\u00a0~327 MB<\/li>\n<\/ul>\n\n\n\n<pre class=\"wp-block-code\"><code># Odczyt\nstart = time.time()\ndf_csv = pd.read_csv('dane.csv')\nprint('CSV odczyt: ', time.time() - start)\n<\/code><\/pre>\n\n\n\n<p>Pliki CSV to prawdopodobnie pierwsze pliki z jakimi mamy do czynienia pracuj\u0105c z Pythonem i paczk\u0105 Pandas. Jest to najprostszy format pliku, a jego g\u0142\u00f3wn\u0105 zalet\u0105 jest mo\u017cliwo\u015b\u0107 otwarcia w ka\u017cdym pakiecie biurowym jak MS Office czy OpenOffice. Dzi\u0119ki temu dane zapisane w ten spos\u00f3b mog\u0105 trafi\u0107 bezpo\u015brednio do mniej technicznych os\u00f3b. Minusem jest wydajno\u015b\u0107 &#8211; ka\u017cdy z 3 wylistowanych powy\u017cej parametr\u00f3w wygl\u0105da lepiej u &#8222;konkurencji&#8221;.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Parquet &#8211; z\u0142oty standard Data Engineera<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Czas zapisu:<\/strong>\u00a01,7193 s<\/li>\n\n\n\n<li><strong>Czas odczytu:<\/strong>\u00a00,6834 s<\/li>\n\n\n\n<li><strong>Rozmiar pliku na dysku:<\/strong>\u00a0~108 MB<\/li>\n<\/ul>\n\n\n\n<p>Python<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code># Zapis\nstart = time.time()\ndf.to_parquet('dane.parquet', index=False)\nprint('Parquet zapis: ', time.time() - start)\n\n# Odczyt\nstart = time.time()\ndf_parquet = pd.read_parquet('dane.parquet')\nprint('Parquet odczyt: ', time.time() - start)\n<\/code><\/pre>\n\n\n\n<p>Parquet to bardzo popularny wyb\u00f3r w projektach Data Engineeringowych i wsz\u0119dzie tam, gdzie pracujemy na wi\u0119kszych wolumenach danych. Jego ogromn\u0105 zalet\u0105 jest wydajno\u015b\u0107 zar\u00f3wno przy zapisie, jak i przy odczycie. Nasz przyk\u0142ad to jeden ca\u0142kiem spory DataFrame, ale przy pracy z wieloma plikami kilkukrotny uzysk na czasie potrafi zaoszcz\u0119dzi\u0107 godziny. Dodatkowo pliki parquet zajmuj\u0105 zdecydowanie mniej miejsca na dysku ni\u017c CSV poniewa\u017c korzystaj\u0105 z kompresji i przechowuj\u0105 dane w formacie kolumnowym. Z kolei to przydaje si\u0119 przy analizie danych, np. je\u015bli chcemy wykorzysta\u0107 jedynie cz\u0119\u015b\u0107 kolumn. Minusem jest mniejsza przyst\u0119pno\u015b\u0107, formatu parquet nie otworzy si\u0119 korzystaj\u0105c z pakietu biurowego MS Office albo OpenOffice.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Feather &#8211; szybko\u015b\u0107 przede wszystkim<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Czas zapisu:<\/strong>\u00a00,7579 s<\/li>\n\n\n\n<li><strong>Czas odczytu:<\/strong>\u00a00,3905 s<\/li>\n\n\n\n<li><strong>Rozmiar pliku na dysku:<\/strong>\u00a0~171 MB<\/li>\n<\/ul>\n\n\n\n<pre class=\"wp-block-code\"><code># Zapis\nstart = time.time()\ndf.to_feather('dane.feather')\nprint('Feather zapis: ', time.time() - start)\n\n# Odczyt\nstart = time.time()\ndf_feather = pd.read_feather('dane.feather')\nprint('Feather odczyt: ', time.time() - start)\n<\/code><\/pre>\n\n\n\n<p>Feather to format, kt\u00f3ry \u015bwietnie si\u0119 sprawdza gdy zale\u017cy nam przede wszystkim na szybko\u015bci &#8211; przede wszystkim odczytu. Sw\u00f3j niski czas odczytu zawdzi\u0119cza temu, \u017ce jest oparty o&nbsp;<em>Apache Arrow<\/em>, czyli o kolumnowy format przechowywania danych zaprojektowany z my\u015bl\u0105 o bardzo szybkim dost\u0119pie do pami\u0119ci. W praktyce oznacza to, \u017ce dane s\u0105 zapisane w spos\u00f3b bardzo uporz\u0105dkowany i bliski temu jak program i tak chce z nich skorzysta\u0107. W przeciwie\u0144stwie do np. CSV nie trzeba sparsowa\u0107 tekstu, rozpoznawa\u0107 separator\u00f3w i odgadywa\u0107 typ\u00f3w danych &#8211; plik mo\u017cna praktycznie od razu za\u0142adowa\u0107 do DataFrame&#8217;a. Minusem formatu Feather jest troch\u0119 wi\u0119kszy rozmiar pliku. Cz\u0119sto przegrywa przez to z parquetem, gdy\u017c cz\u0119sto czasy odczytu i zapisu s\u0105 ju\u017c w nim wystarczaj\u0105co niskie. Niemniej, warto zna\u0107 i ten format &#8211; na pewno przyda si\u0119 w sytuacjach, gdy to szybko\u015b\u0107 ma najwi\u0119ksze znaczenie.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Pickle &#8211; wygoda kosztem uniwersalno\u015bci<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Czas zapisu:<\/strong>\u00a02,3001 s<\/li>\n\n\n\n<li><strong>Czas odczytu:<\/strong>\u00a01,0439 s<\/li>\n\n\n\n<li><strong>Rozmiar pliku na dysku:<\/strong>\u00a0~305 MB<\/li>\n<\/ul>\n\n\n\n<pre class=\"wp-block-code\"><code># Zapis\nstart = time.time()\ndf.to_pickle('dane.pkl')\nprint('Pickle zapis: ', time.time() - start)\n\n# Odczyt\nstart = time.time()\ndf_pickle = pd.read_pickle('dane.pkl')\nprint('Pickle odczyt: ', time.time() - start)\n<\/code><\/pre>\n\n\n\n<p>Pickle to format specyficzny dla Pythona &#8211; dzi\u0119ki temu w prosty spos\u00f3b mo\u017cna zapisa\u0107 i odczyta\u0107 dane korzystaj\u0105c z tego j\u0119zyka. W przypadku DataFrame&#8217;\u00f3w dzia\u0142a to ca\u0142kiem sprawnie, co wida\u0107 te\u017c w naszym por\u00f3wnaniu. Jednak Pickle dzia\u0142a tylko w Pythonie, a je\u015bli uwzgl\u0119dni\u0107 te\u017c du\u017cy rozmiar pliku&nbsp;<code>.pkl<\/code>, to jest wybierany bardzo rzadko. Mimo to, mo\u017ce si\u0119 przyda\u0107 w sytuacjach, gdy zapis DataFrame&#8217;a do format\u00f3w Parquet czy Feather wymaga czasoch\u0142onnej transformacji danych. Listy i s\u0142owniki w DataFrame&#8217;ach nie s\u0105 zwyk\u0142ymi typami tabelarycznymi i trzeba je najpierw ujednolici\u0107. To mo\u017ce by\u0107 problematyczne, wymaga przetestowania pod k\u0105tem znikaj\u0105cych danych itp. &#8211; Pickle zapisze taki &#8222;trudny&#8221; DataFrame bez problemu.<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<p>Ostatecznie nie istnieje jeden &#8222;najlepszy&#8221; format zapisu danych. Jak wida\u0107, ka\u017cdy z wymienionych ma swoje plusy i minusy. Sztuk\u0105 jest zidentyfikowa\u0107, czy w naszym projekcie na danym etapie potrzebna jest interakcja z nietechnicznym u\u017cytkownikiem, ma\u0142y rozmiar pliku, a mo\u017ce szybki jego odczyt i zapis? CSV wygrywa uniwersalno\u015bci\u0105, Parquet i Feather &#8211; rozmiarem i szybko\u015bci\u0105. A przy pracy z bardziej skomplikowanymi obiektami Pythona warto pami\u0119ta\u0107 o Pickle.<\/p>\n\n\n\n<p>Je\u015bli interesuj\u0105 ci\u0119 zagadnienia zwi\u0105zane z Pythonem, chcia\u0142by\u015b zag\u0142\u0119bi\u0107 temat wykorzystania r\u00f3\u017cnych format\u00f3w plik\u00f3w i pozna\u0107 r\u00f3\u017cne technologie zwi\u0105zane z prac\u0105 Data Engineera, koniecznie sprawd\u017a nasz kurs <a href=\"https:\/\/infoshareacademy.com\/kurs\/kurs-data-engineer\/\">Data Engineera<\/a> na infoShare Academy!<\/p>\n\n\n\n<div class=\"wp-block-media-text\" style=\"grid-template-columns:30% auto\"><figure class=\"wp-block-media-text__media\"><a href=\"https:\/\/www.linkedin.com\/in\/artur-dzieciol\/\"><img loading=\"lazy\" decoding=\"async\" width=\"800\" height=\"800\" src=\"https:\/\/infoshareacademy.com\/blog\/wp-content\/uploads\/2026\/01\/1744180292399.jpeg\" alt=\"\" class=\"wp-image-13830 size-full\" srcset=\"https:\/\/infoshareacademy.com\/blog\/wp-content\/uploads\/2026\/01\/1744180292399.jpeg 800w, https:\/\/infoshareacademy.com\/blog\/wp-content\/uploads\/2026\/01\/1744180292399-300x300.jpeg 300w, https:\/\/infoshareacademy.com\/blog\/wp-content\/uploads\/2026\/01\/1744180292399-150x150.jpeg 150w, https:\/\/infoshareacademy.com\/blog\/wp-content\/uploads\/2026\/01\/1744180292399-768x768.jpeg 768w\" sizes=\"auto, (max-width: 800px) 100vw, 800px\" \/><\/a><\/figure><div class=\"wp-block-media-text__content\">\n<p class=\"has-text-color has-link-color has-small-font-size wp-elements-1bbb0784632c2c8053f8f57289b5b8da\" style=\"color:#9b9b9b\">Autor<\/p>\n\n\n\n<p class=\"has-medium-font-size\"><strong><a href=\"https:\/\/www.linkedin.com\/in\/artur-dzieciol\/\">Artur Dzi\u0119cio\u0142 [in]<\/a><\/strong><\/p>\n\n\n\n<p class=\"has-small-font-size\">Data Engineer @ CBRE | Python | PySpark | AWS | PostgreSQL | Terraform | CI\/CD | Docker | Tableau<\/p>\n\n\n\n<p class=\"has-small-font-size\">Jestem Data Engineerem z ponad 7-letnim do\u015bwiadczeniem. Przeszed\u0142em \u015bcie\u017ck\u0119 od analityka i BI Developera (Excel, Tableau) do obecnej roli opartej na Pythonie, SQL i AWS. Do\u015bwiadczenie w pracy z biznesem pozwala mi patrze\u0107 na dane kompleksowo. Obecnie skupiam si\u0119 na backendzie, a pasj\u0119 do nauki realizuj\u0119 na bootcampach, gdzie wyja\u015bniam skomplikowane technologie prostymi s\u0142owami.<\/p>\n<\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Praca z danymi to codzienno\u015b\u0107 w \u015bwiecie Data. Niezale\u017cnie od tego, czy budujemy pipeline ETL, analizujemy dane w Jupyter notebooku, lub zapisujemy wyniki modelu ML &#8211; dane wyj\u015bciowe b\u0119d\u0105 zapisane w jednym z kilku popularnych format\u00f3w. Chocia\u017c zapis danych do pliku to tylko jedna linijka kodu, odpowiedni format wp\u0142ywa na czytelno\u015b\u0107, rozmiar oraz czas zapisu &hellip;<\/p>\n","protected":false},"author":18,"featured_media":13953,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[205,33,27],"tags":[],"class_list":["post-13946","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-big-data","category-data-science","category-poradniki"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v20.7 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Warsztat Data Engineera - kiedy wybra\u0107 CSV, parquet, feather albo pickle? - infoShare Academy Blog<\/title>\n<meta name=\"description\" content=\"Dowiedz si\u0119 jak dobiera\u0107 format dla danych wyj\u015bciowych w projektach Data Enigneera - kiedy wybra\u0107 CSV, parquet, feather albo pickle?\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/\" \/>\n<meta property=\"og:locale\" content=\"pl_PL\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Warsztat Data Engineera - kiedy wybra\u0107 CSV, parquet, feather albo pickle? - infoShare Academy Blog\" \/>\n<meta property=\"og:description\" content=\"Dowiedz si\u0119 jak dobiera\u0107 format dla danych wyj\u015bciowych w projektach Data Enigneera - kiedy wybra\u0107 CSV, parquet, feather albo pickle?\" \/>\n<meta property=\"og:url\" content=\"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/\" \/>\n<meta property=\"og:site_name\" content=\"infoShare Academy Blog\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/infoshareacademy\" \/>\n<meta property=\"article:published_time\" content=\"2026-03-24T11:14:57+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2026-03-24T11:18:50+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/infoshareacademy.com\/blog\/wp-content\/uploads\/2026\/03\/wordpress-wpis-na-bloga.png\" \/>\n\t<meta property=\"og:image:width\" content=\"1200\" \/>\n\t<meta property=\"og:image:height\" content=\"628\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"mateusz.piernikarczyk@infoshareacademy.com\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Napisane przez\" \/>\n\t<meta name=\"twitter:data1\" content=\"mateusz.piernikarczyk@infoshareacademy.com\" \/>\n\t<meta name=\"twitter:label2\" content=\"Szacowany czas czytania\" \/>\n\t<meta name=\"twitter:data2\" content=\"6 minut\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/\"},\"author\":{\"name\":\"mateusz.piernikarczyk@infoshareacademy.com\",\"@id\":\"https:\/\/infoshareacademy.com\/blog\/#\/schema\/person\/bfda6d1aeb19909ac4aeee2b2986c8e2\"},\"headline\":\"Warsztat Data Engineera &#8211; kiedy wybra\u0107 CSV, parquet, feather albo pickle?\",\"datePublished\":\"2026-03-24T11:14:57+00:00\",\"dateModified\":\"2026-03-24T11:18:50+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/\"},\"wordCount\":932,\"publisher\":{\"@id\":\"https:\/\/infoshareacademy.com\/blog\/#organization\"},\"articleSection\":[\"Big Data\",\"Data Science\",\"Poradniki\"],\"inLanguage\":\"pl-PL\"},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/\",\"url\":\"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/\",\"name\":\"Warsztat Data Engineera - kiedy wybra\u0107 CSV, parquet, feather albo pickle? - infoShare Academy Blog\",\"isPartOf\":{\"@id\":\"https:\/\/infoshareacademy.com\/blog\/#website\"},\"datePublished\":\"2026-03-24T11:14:57+00:00\",\"dateModified\":\"2026-03-24T11:18:50+00:00\",\"description\":\"Dowiedz si\u0119 jak dobiera\u0107 format dla danych wyj\u015bciowych w projektach Data Enigneera - kiedy wybra\u0107 CSV, parquet, feather albo pickle?\",\"breadcrumb\":{\"@id\":\"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/#breadcrumb\"},\"inLanguage\":\"pl-PL\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Strona g\u0142\u00f3wna\",\"item\":\"https:\/\/infoshareacademy.com\/blog\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Warsztat Data Engineera &#8211; kiedy wybra\u0107 CSV, parquet, feather albo pickle?\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/infoshareacademy.com\/blog\/#website\",\"url\":\"https:\/\/infoshareacademy.com\/blog\/\",\"name\":\"infoShare Academy Blog\",\"description\":\"Strona o szkoleniach w IT\",\"publisher\":{\"@id\":\"https:\/\/infoshareacademy.com\/blog\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/infoshareacademy.com\/blog\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"pl-PL\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/infoshareacademy.com\/blog\/#organization\",\"name\":\"infoShare Academy\",\"url\":\"https:\/\/infoshareacademy.com\/blog\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pl-PL\",\"@id\":\"https:\/\/infoshareacademy.com\/blog\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/infoshareacademy.com\/blog\/wp-content\/uploads\/2022\/11\/infoShare-Academy-ver-white-with-background-1000x1000px.jpg\",\"contentUrl\":\"https:\/\/infoshareacademy.com\/blog\/wp-content\/uploads\/2022\/11\/infoShare-Academy-ver-white-with-background-1000x1000px.jpg\",\"width\":1000,\"height\":1000,\"caption\":\"infoShare Academy\"},\"image\":{\"@id\":\"https:\/\/infoshareacademy.com\/blog\/#\/schema\/logo\/image\/\"},\"sameAs\":[\"https:\/\/www.facebook.com\/infoshareacademy\"]},{\"@type\":\"Person\",\"@id\":\"https:\/\/infoshareacademy.com\/blog\/#\/schema\/person\/bfda6d1aeb19909ac4aeee2b2986c8e2\",\"name\":\"mateusz.piernikarczyk@infoshareacademy.com\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pl-PL\",\"@id\":\"https:\/\/infoshareacademy.com\/blog\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/8d0d979a4d1ae0c5371979c94555e365d334d1534337ad5568a7e9c757324d94?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/8d0d979a4d1ae0c5371979c94555e365d334d1534337ad5568a7e9c757324d94?s=96&d=mm&r=g\",\"caption\":\"mateusz.piernikarczyk@infoshareacademy.com\"},\"url\":\"https:\/\/infoshareacademy.com\/blog\/author\/mateusz-piernikarczykinfoshareacademy-com\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Warsztat Data Engineera - kiedy wybra\u0107 CSV, parquet, feather albo pickle? - infoShare Academy Blog","description":"Dowiedz si\u0119 jak dobiera\u0107 format dla danych wyj\u015bciowych w projektach Data Enigneera - kiedy wybra\u0107 CSV, parquet, feather albo pickle?","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/","og_locale":"pl_PL","og_type":"article","og_title":"Warsztat Data Engineera - kiedy wybra\u0107 CSV, parquet, feather albo pickle? - infoShare Academy Blog","og_description":"Dowiedz si\u0119 jak dobiera\u0107 format dla danych wyj\u015bciowych w projektach Data Enigneera - kiedy wybra\u0107 CSV, parquet, feather albo pickle?","og_url":"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/","og_site_name":"infoShare Academy Blog","article_publisher":"https:\/\/www.facebook.com\/infoshareacademy","article_published_time":"2026-03-24T11:14:57+00:00","article_modified_time":"2026-03-24T11:18:50+00:00","og_image":[{"width":1200,"height":628,"url":"https:\/\/infoshareacademy.com\/blog\/wp-content\/uploads\/2026\/03\/wordpress-wpis-na-bloga.png","type":"image\/png"}],"author":"mateusz.piernikarczyk@infoshareacademy.com","twitter_card":"summary_large_image","twitter_misc":{"Napisane przez":"mateusz.piernikarczyk@infoshareacademy.com","Szacowany czas czytania":"6 minut"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/#article","isPartOf":{"@id":"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/"},"author":{"name":"mateusz.piernikarczyk@infoshareacademy.com","@id":"https:\/\/infoshareacademy.com\/blog\/#\/schema\/person\/bfda6d1aeb19909ac4aeee2b2986c8e2"},"headline":"Warsztat Data Engineera &#8211; kiedy wybra\u0107 CSV, parquet, feather albo pickle?","datePublished":"2026-03-24T11:14:57+00:00","dateModified":"2026-03-24T11:18:50+00:00","mainEntityOfPage":{"@id":"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/"},"wordCount":932,"publisher":{"@id":"https:\/\/infoshareacademy.com\/blog\/#organization"},"articleSection":["Big Data","Data Science","Poradniki"],"inLanguage":"pl-PL"},{"@type":"WebPage","@id":"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/","url":"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/","name":"Warsztat Data Engineera - kiedy wybra\u0107 CSV, parquet, feather albo pickle? - infoShare Academy Blog","isPartOf":{"@id":"https:\/\/infoshareacademy.com\/blog\/#website"},"datePublished":"2026-03-24T11:14:57+00:00","dateModified":"2026-03-24T11:18:50+00:00","description":"Dowiedz si\u0119 jak dobiera\u0107 format dla danych wyj\u015bciowych w projektach Data Enigneera - kiedy wybra\u0107 CSV, parquet, feather albo pickle?","breadcrumb":{"@id":"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/#breadcrumb"},"inLanguage":"pl-PL","potentialAction":[{"@type":"ReadAction","target":["https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/infoshareacademy.com\/blog\/warsztat-data-engineera-kiedy-wybrac-csv-parquet-feather-albo-pickle\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Strona g\u0142\u00f3wna","item":"https:\/\/infoshareacademy.com\/blog\/"},{"@type":"ListItem","position":2,"name":"Warsztat Data Engineera &#8211; kiedy wybra\u0107 CSV, parquet, feather albo pickle?"}]},{"@type":"WebSite","@id":"https:\/\/infoshareacademy.com\/blog\/#website","url":"https:\/\/infoshareacademy.com\/blog\/","name":"infoShare Academy Blog","description":"Strona o szkoleniach w IT","publisher":{"@id":"https:\/\/infoshareacademy.com\/blog\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/infoshareacademy.com\/blog\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"pl-PL"},{"@type":"Organization","@id":"https:\/\/infoshareacademy.com\/blog\/#organization","name":"infoShare Academy","url":"https:\/\/infoshareacademy.com\/blog\/","logo":{"@type":"ImageObject","inLanguage":"pl-PL","@id":"https:\/\/infoshareacademy.com\/blog\/#\/schema\/logo\/image\/","url":"https:\/\/infoshareacademy.com\/blog\/wp-content\/uploads\/2022\/11\/infoShare-Academy-ver-white-with-background-1000x1000px.jpg","contentUrl":"https:\/\/infoshareacademy.com\/blog\/wp-content\/uploads\/2022\/11\/infoShare-Academy-ver-white-with-background-1000x1000px.jpg","width":1000,"height":1000,"caption":"infoShare Academy"},"image":{"@id":"https:\/\/infoshareacademy.com\/blog\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/infoshareacademy"]},{"@type":"Person","@id":"https:\/\/infoshareacademy.com\/blog\/#\/schema\/person\/bfda6d1aeb19909ac4aeee2b2986c8e2","name":"mateusz.piernikarczyk@infoshareacademy.com","image":{"@type":"ImageObject","inLanguage":"pl-PL","@id":"https:\/\/infoshareacademy.com\/blog\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/8d0d979a4d1ae0c5371979c94555e365d334d1534337ad5568a7e9c757324d94?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/8d0d979a4d1ae0c5371979c94555e365d334d1534337ad5568a7e9c757324d94?s=96&d=mm&r=g","caption":"mateusz.piernikarczyk@infoshareacademy.com"},"url":"https:\/\/infoshareacademy.com\/blog\/author\/mateusz-piernikarczykinfoshareacademy-com\/"}]}},"_links":{"self":[{"href":"https:\/\/infoshareacademy.com\/blog\/wp-json\/wp\/v2\/posts\/13946","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/infoshareacademy.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/infoshareacademy.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/infoshareacademy.com\/blog\/wp-json\/wp\/v2\/users\/18"}],"replies":[{"embeddable":true,"href":"https:\/\/infoshareacademy.com\/blog\/wp-json\/wp\/v2\/comments?post=13946"}],"version-history":[{"count":6,"href":"https:\/\/infoshareacademy.com\/blog\/wp-json\/wp\/v2\/posts\/13946\/revisions"}],"predecessor-version":[{"id":13952,"href":"https:\/\/infoshareacademy.com\/blog\/wp-json\/wp\/v2\/posts\/13946\/revisions\/13952"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/infoshareacademy.com\/blog\/wp-json\/wp\/v2\/media\/13953"}],"wp:attachment":[{"href":"https:\/\/infoshareacademy.com\/blog\/wp-json\/wp\/v2\/media?parent=13946"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/infoshareacademy.com\/blog\/wp-json\/wp\/v2\/categories?post=13946"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/infoshareacademy.com\/blog\/wp-json\/wp\/v2\/tags?post=13946"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}