Prasówka IT SALESmanago to zbiór nowości, ciekawostek i rozwiązań z zakresu programowania, Big Data, Machine Learning & AI oraz budowania zaawansowanych systemów informatycznych.
Co dwa tygodnie nasi specjaliści selekcjonują kilka najważniejszych i najciekawszych artykułów. W tym wydaniu m.in. retusz zdjęć za pomocą Deep Learning, najpopularniejsze biblioteki dla języka Java i anonimizacja danych z PostgreSQL.
Machine Learning & AI
Deep Learning sprawi, że twoje zdjęcia staną się piękne
Jeśli na twoich wakacjach było zbyt mało słońca a zdjęcia wyszły nieostre, to dzięki pomocy Deep Learningu możesz je w łatwy sposób automatycznie poprawić. W artykule przykład jak z pomocą TensorFlow, NumPy i SciPy sprawić, żeby zdjęcia nabrały bardziej profesjonalnego wyglądu.
Analiza sentymentu przy pomocy AI
Analiza sentymentu to nie tylko detekcja tematu wypowiedzi, ale również bardzo szerokie zagadnienie pozwalające zidentyfikować emocje kryjące się za tekstem – nazywa się to również eksploracją opinii (opinion mining) lub emotion AI.
Bardzo często sentyment danego słowa kryje się w kontekście danego zdania lub całego tekstu. Jak to rozpoznawać? Jakich narzędzi użyć?
Dowiesz się tego z poniższego artykułu:
https://www.infoq.com/articles/sentiment-analysis-whats-with-the-tone
Programowanie Ogólne
API – najważniejsze elementy na podstawie 100 wdrożonych projektów
Interfejsy API służą do komunikacji pomiędzy dwoma systemami – najczęściej jest to wywołanie zdalnych serwisów. W jaki sposób tworzyć API, aby były wydajne, szybkie i bezpieczne? Najlepsze porady znajdziesz w poniższym artykule:
https://nordicapis.com/key-lessons-from-100-api-projects/
Top 100 bibliotek dla języka Java
Od kilku lat pozycja języka Java w technologiach programowania konsekwentnie się wzmacnia. Na podstawie ponad 270 tysięcy przeanalizowanych plików źródłowych wybranych zostało Top 100 najpopularniejszych bibliotek dla Javy:
https://blog.overops.com/the-top-100-java-libraries-in-2018-based-on-277975-source-files/
Bazy danych & Big Data
Load Balancing i Connection Pooling przy pomocy PgPool-II
Load Balancing to bardzo ważne zagadnienie w kontekście wzrastającego ruchu w Twojej aplikacji. Często w tym przypadku wąskim gardłem okazują się zasoby bazodanowe – w poniższym artykule dowiesz się jak równoważyć obciążenie i rozłożyć je na kilka maszyn bazodanowych przy użyciu PgPool-II.
Anonimizacja danych – jak to zrobić z PostgreSQL?
Temat anonimizacji danych zwykle jest bardzo szerokim i wymagającym zagadnieniem, z którym w kontekście przepisów GDPR zmaga się wiele organizacji. Na szczęście PostgreSQL posiada wiele mechanizmów, aby sprostać tym wymaganiom. W poniższym artykule znajdziesz przegląd i sposób implementacji poszczególnych strategii anonimizacji:
http://blog.taadeem.net///english/2019/01/03/8_anonymization_strategies_with_postgres
Apache Kafka – najlepsze praktyki do optymalizacji deploymentu
Swoją popularność w projektach Big Data Apache Kafka zawdzięcza między innymi szybkiej i wygodnej implementacji oraz możliwości działania w klastrach składających się z relatywnie tanich maszyn. Jednak wdrożenie tego typu rozwiązań na środowisko to nie koniec pracy – działające elementy należy monitorować i tuningować. W jaki sposób zapewnić poprawność działania, wysoką wydajność i spokojny sen?
https://www.infoq.com/articles/apache-kafka-best-practices-to-optimize-your-deployment
Monitoring aplikacji Apache Spark przy użyciu InfluxDB i Grafany
Apache Spark stał się niezwykle popularną technologią wykorzystywaną w firmach pracujących z projektami Big Data. Spark oferuje wiele ciekawych mechanizmów równoległej analizy i przetwarzania danych – zarówno w czasie rzeczywistym, jak i w sposób batchowy.
Aby zapewnić niezawodność takiego rozwiązania, potrzebny jest dobry monitoring infrastruktury – dobrze do tego nadają się rozwiązania InfluxDB oraz Grafana:
https://www.infoq.com/articles/spark-application-monitoring-influxdb-grafana
Frontend
Webpack – od podstaw do testów automatycznych
Wśród frontendowców można usłyszeć następujący żart – jeśli danego dnia nie powstał żaden nowy framework do JavaScriptu – jest to dzień stracony. Sama technologia i cały ekosystem wokół JavaScript nieustannie się zmienia. W poniższym artykule dowiesz się jak to wszystko połączyć.
https://itnext.io/webpack-from-0-to-automated-testing-4634844d5c3c
Wydajność Frontendu – checklista na 2019
Ocena wydajności działania Frontendu i wskazanie wąskich gardeł jest procesem skomplikowanym – może to być ciężki kod JavaScript, powolne ładowanie zewnętrznych zasobów lub choćby ciężkie obrazki. Wydajność powinna być stale mierzona, monitorowana i udoskonalana. Na szczęście w 2019 roku istnieje już wiele zbiorów dobrych praktyk w tym temacie:
https://www.smashingmagazine.com/2019/01/front-end-performance-checklist-2019-pdf-pages/