converter

Konwerter kodowania

Aktualny limit: 10MB na jeden plik

Wybór kodowań



Wybór pliku
(max: 10MB z rozszerzeniami .txt, .sql, .htm, .html)


||

Jakieś pytania, większe pliki? contact lub zobacz moje portfolio

Informacje o obsługiwanych kodowaniach

Informacje w trakcie tworzenia

ISO/IEC 8859
Definicja kodowania ISO
ISO-8859-1
Definicja 1
ISO-8859-2
Definicja 2
ISO-8859-3
Definicja 3
ISO-8859-4
Definicja 4
ISO-8859-5
Definicja 5
ISO-8859-6
Definicja 6
ISO-8859-7
Definicja 7
ISO-8859-8
Definicja 8
ISO-8859-9
Definicja 9
ISO-8859-10
Definicja 10
ISO-8859-11
Definicja 11
ISO-8859-12
Kodowanie nie istnieje
ISO-8859-13
Definicja 13
ISO-8859-14
Definicja 14
ISO-8859-15
Definicja 15
ISO-8859-16
Definicja 16
Unicode
Definicja Unicode
UTF-8
definicja utfa 1
UTF-16
definicja utfa 2
Windows CP
Definicja kodowań z rodziny Windows
CP1250
definicja w1
CP1251
definicja w2
Inne kodowania
Definicje przeróżnych kodowań i kombinacji
latin1/latin2
definicja mieszanki 1
latin1/latin2/utf-8
definicja mieszanki 2
FAQ – pytania i odpowiedzi oraz definicje
ASCII
Kodowanie bazujące na kolejności angielskiego alfabetu. Bardzo wiele kodowań bazuje na tablicy ASCII oraz obsługuje wiele innych znaków spoza niej. Pierwsze 32 znaki to znaki kontrolne (od 0 do 31 w systemie dziesiętnym) natomiast kolejne 95 znaków to litery, liczby oraz znaki przestankowe jak i kilka innych (od 32 włącznie do 126).
UNICODE
Tablica znaków obsługująca w zamierzeniu wszystkie kroje i czcionki pisma świata oraz wszelkie symbole. Sposoby kodowania bajtów to UCS lub UTF. Zdefiniowane za pomocą dwóch identycznych standardów jeden od konsorcjum Unicode drugi przez ISO, są identyczne.
IANA
IANA (ang. Internet Assigned Numbers Authority) amerykańska organizacja podległa ichniejszemu rządowi. Aktualnie zarządza domenami najwyższego poziomu oraz głównym systemem DNS. Cenzurują treści niewygodne dla rządu USA poprzez zmianę delegacji w serwerach DNS nie usuwając rzeczywistej treści. Adresami IP zajmuje się aktualnie ICANN. Nie lubimy tych organizacji.
hexadecimal
Kod w systemie szesnastkowym (heksadecymalnym).
decimal
Kod w systemie dziesiętnym (decymalnym).
octal
Kod w systemie ósemkowym (oktalnym).
binary
Kod w systemie dwójkowym (binarnym).
character
Widoczny znak; wygląd znaku albo jego reprezentacja drukowalna (widziana na wydruku).
character name
Nazwa znaku character w prezentacji html.
html entity
Encja html; wprowadzana poprzez poprzedzający znak & (ampersand), następnie nazwa znaku w html oraz zakończenie encji poprzez znak ; (średnik). Przykładowo znak copyright – ©; encja html będzie wyglądać następująco © dla tego znaku.
html entity decimal
Encja html zapisana w formie liczbowej dziesiętnej; zaczyna się od znaku & (ampersand), następnie # (hash; płotek) oraz tuż za nim należy podać numer znaku z Unicode w systemie dziesiętnym decimal oraz zakończyć należy znakiem ; (średnik). Przykładowo znak copyright – ©; encja w systemie dziesiętnym będzie wyglądać tak: ©.Należy uważać aby to była reprezentacja znaku z Unicode w systemie dziesiętnym a nie innego kodowania!
html entity hexadecimal
Encje html zapisane w systemie szesnastkowym, jak wszystkie encje html zaczyna się od & (ampersand), następnie należy wpisać # (hash; płotek) a tuż za nim mała literkę x (iks) oraz po tych znakach musi się znaleźć reprezentacja znaku Unicode w systemie szesnastkowym hexadecimal oraz zakończyć należy znakiem ; (średnik). Przykładowo znak copyright – ©; encja w systemie szesnastkowym będzie wyglądać tak: ©.
unicode hexadecimal
Znak zapisany w Unicode za pomocą systemu szesnastkowego.
unicode decimal
Znak zapisany w Unicode za pomocą systemu dziesiętnego.
unicode octal
Znak zapisany w Unicode za pomocą systemu ósemkowego.
unicode binary
Znak zapisany w Unicode za pomocą systemu dwójkowego.
description ascii
Opis według normy ASCII; oryginalna angielska pisownia.
znaki diakrytyczne
Z greckiego diakritikós – odróżniający – znaki graficzne używane w alfabetach wielu języków zbudowanych na alfabecie łacińskim, umieszczane nad, pod, obok lub wewnątrz litery, zmieniające artykulację tej litery i tworzące przez to nową literę. W alfabetach sylabowych mogą zmienić znaczenie całej sylaby.
BOM
Byte Order Mark – znacznik kolejności bajtów, znajduje się na początku pliku wielobajtowego kodowania, informuje o kolejności w jakiej należy odczytywać bajty znaków. Przy korzystaniu z kodowania UTF-8 często powoduje on problemy. (nie uruchamiają się skrypty PHP, bądź nie widać polskich znaków lub polskie znaki nie działają tylko w niektórych przeglądarkach, często uwidaczniają się na początku strony 3 znaki  lub ďťż)

23 Comments

  1. Oszczędziłeś mi nieprzespanej nocy przy konwertowaniu znaków. Wielkie dzięki za converter.

  2. tosiek

    24.11.2009 at 00:40

    To mam choć ciut motywacji żeby dopracować ten konwerter i opisać więcej informacji na temat kodowań, tylko ciut to mniejsza cząstka mniejszości…

  3. Dzięki tosiek za funkcję remove_pl, siadła mi zajebiście… ; )

  4. tosiek

    27.11.2009 at 14:00

    Co inny ludź to inne znaczenie słowa siąść… Chyba jednak tamta funkcja nadal działa?

    A poza tym, jeśli korzystamy z kodowania ISO-8859-2 to polecam tę funkcję usuwanie polskich znaków specjalnych z kodowania iso-8859-2 latin2 i te tablice do usuwania znaków ogonkowo daszkowo kreskowych nie tylko polskich lecz wszelkich z całej tablicy kodowania ISO-8859-2, czyli wszystkie znaki ze wszystkich języków jakie to kodowanie obsługuje. Niedługo opisze metodę dla utf-8.

  5. Dzięki za pomocne narzędzie – ten konwerter to super sprawa !

  6. o kurwa ;o

    01.05.2010 at 13:37

    Tosiek thx za to ; )
    PzdRo

  7. rewelacja – thx :-)

  8. Witam Cię tosiek . Zrobiłem konwersje z przema na phpbb3 okey wszystko poszło gładko oprócz polskich znaków …
    Zrobiłem tak :
    Przekonwertowaną bazę danych ( phpbb3 ). Bazę danych i ja przekonwertowałem z Windows-1250 ( CP-1250 ) na ISO-8859-2 ( latin2 )

    Wgrałem bazę danych w trybie binary poprzez phpMyAdmin’a i i jest jak było : ( kurde tosiek pomożesz coś ?

    • tosiek

      13.08.2010 at 08:57

      Mógłbyś mi wytłumaczyć dlaczego konwertowałeś z Windows-1250?

      Powinieneś przed konwersją zmienić kodowanie bazy przema na latin2 i odpowiednio ustawić za pomocą SET NAMES połączenie i dopiero potem zacząć konwersję na phpbb3.

      Po konwersji do phpbb3 sprawdź czy w bazie masz krzaczki czy już znaki zapytania.

  9. Witam
    Dziękuję za możliwość skorzystania z tego narzędzia! :)
    Serdecznie POZDRAWIAM!

    PS.
    Mam wrażenie, że jest jeszcze jedna luka: w wyniku konwersji z latin2 na utf8 w pliku zamiast ń jest ñ (n z tyldą).

  10. Twoje fantastyczne narzędzie, bardzo mi pomogło. Serdeczne dzięki! Pozdrawiam! :)

  11. Czy jest mozliwosc jednorazowego przekonwertowania bazy o wielkosci 50MB ?

  12. Próbuję przekonwertować plik .sql 13,8MB i niestety bez rezultatu. Może jest jakaś wersja offline (lokalnie)?

    • tosiek

      11.03.2011 at 12:57

      Co oznacza “bez rezultatu”? Jeżeli zamiast nawet krzaczków są znaki zapytania w naprawianej kopii bazy to ten skrypt cudów nie robi…

  13. Wow świetna robota! strona dodana do ulubionych nie raz jeszcze pewnie skorzystam jak będę przenosił bazy ze starych śmieci na nowe utf8 ;)
    ps: tak jak SławekP mówił jest problem z ń, ź i jeszcze jakaś, ale pewnie w nowej wersji to już jest poprawione :)
    pozdro i gratulacje!

  14. super, wielkie dzieki za wspaniale narzedzie :) jak to milo ze sa jeszcze ludzie na tym swiecie ktorzy chca pomoc innym :)

  15. Fajnie ino szkoda ze moja baza ma 55mb, to sie przysłużyło heh.

  16. No ja bym tez skozystal ale moja baza ma ponad 1gb , podzielic? no tabela post na z 400mb nie wspome o reszcie :(

  17. Nie przesadzę, jeśli napiszę, że kocham Twoją stronę!!!
    Dzięki wiele. Jestem Twoją dłużniczką :)

  18. nie działa …

  19. Świetna robota. Dzięki za odjęcie mnóstwa pracy!

Dodaj komentarz