CCDC144A
CCDC144A | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Identifikatori | |||||||||||||||||||||||||
Aliasi | CCDC144A | ||||||||||||||||||||||||
Vanjski ID-jevi | HomoloGene: 108248 GeneCards: CCDC144A | ||||||||||||||||||||||||
| |||||||||||||||||||||||||
Ortolozi | |||||||||||||||||||||||||
Vrste | Čovjek | Miš | |||||||||||||||||||||||
Entrez |
| ||||||||||||||||||||||||
Ensembl |
| ||||||||||||||||||||||||
UniProt |
| ||||||||||||||||||||||||
RefSeq (mRNK) |
| ||||||||||||||||||||||||
RefSeq (bjelančevina) |
| ||||||||||||||||||||||||
Lokacija (UCSC) | Chr 17: 16.69 – 16.78 Mb | n/a | |||||||||||||||||||||||
PubMed pretraga | [2] | n/a | |||||||||||||||||||||||
Wikipodaci | |||||||||||||||||||||||||
|
Domen upredene zavojnice sa proteinom 144A je protein koji je kod ljudi kodiran genom CCDC144A.[3] Alijas ovog gena naziva se KIAA0565. Porodica CCDC ima četiri člana : CCDC 144A, 144B, 144C i pretpostavljeni CCDC 144, N-terminalni protein.[4]
Gen
[uredi | uredi izvor]Ovaj gen ima nukleotidnu sekvencu dugu 5140 bp sa 641 aminokiselinom.[5] Nalazi se na kratkom kraku, plus (prednjeg) lanca hromosoma 17, na p11.2.[6][7] Informacijska RNK gena A CCDC144A ima tri alternativne prerađene izoforme zvane A2RUR9-1, A2RUR9-2 i A2RUR9-3, ali još nemaju eksperimentalnu potvrdu.[8]
Protein
[uredi | uredi izvor]Protein kodiran ovim genom poznat je i kao upredena zavojnica, domen koj sadrži protein 144A (CCDC144A). Sastoji se od 641 aminokiseline.[9] Ovaj protein teži 75,8 kDa i ima izoelektričnu tačku od 6,357.[10] Nalazi se blizu jedra,[11] kao rastvorljivi protein sa hidrofobnosti od -1.021842.[12] Ovaj protein je nesekretorni[13] i ima 10 potencijalnih serina i tri potencijalna treonina fosforilacijskih lokacija.[14] Nema tirozinnsko sulfacijska mjesta,[15] ali na ovom proteinu postoji nekoliko potencijalnih mjesta sumoilacije.[16][17] Predviđa se također da se ovaj protein ne miristoilira.[18] i ne sadrži signalni peptid.[19]
Struktura
[uredi | uredi izvor]Dužina polipeptidnog lanca je 1.427 aminokiselina, sa molekulskom težinom od 165.125[20].
Aminokiselinska sekvenca
10 | 20 | 30 | 40 | 50 | ||||
---|---|---|---|---|---|---|---|---|
MASWGGEKRG | GAEGSPKPAV | YATRKTPSVG | SQGDQWYLGY | PGDQWSSGFP | ||||
YSWWKNSVGS | ESKHGEGALD | QPQHDVRLED | LGELHRAARS | GDVPGVEHIL | ||||
APGDTGVDKR | DRKKSIQQLV | PEYKEKQTPE | SLPQNNNPDW | HPTNLTLSDE | ||||
TCQRSKNLKV | DDKCPSVSPS | MPENQSATKE | LGQMNLTERE | KMDTGVVLLS | ||||
GNDTLHDLCQ | SQLPENKESK | EAEQDSELTS | EEEQERLKGC | ENKQPQKTSQ | ||||
EPEMAKDCDR | EDIPIYPVLP | HVQKSEEMWI | EQGKLEWKNQ | LKLVINELKQ | ||||
RFGEIYEKYK | IPACPEEEPL | LDNSTRGTDV | KDIPFNLTNN | IPGCEEEDAS | ||||
EISVSVVFET | FPEQKEPSLK | NIIHPYYHPY | SGSQEHVCQS | SSKFHLHENK | ||||
LDCDNDNKPG | IGHIFSTDKN | FHNDASTKKA | RNPEVVMVEM | KEDQEFDLQM | ||||
TKNMNQNSDS | GSTNNYKSLK | PKLENLSSLP | PDSDRTSEVY | LHEELQQDMQ | ||||
KFKNEVNTLE | EEFLALKKED | VQLHKDVEEE | MEKHRSNSTE | LSGTLTDGTT | ||||
VGNDDDGLNQ | QIPRKENGEH | DRPADKTSNE | KNEVKNQIYP | EADFADSMEP | ||||
SEIASEDCEL | SHSVYENFML | LIEQLRMEYK | DSASLPRIQD | TFCLCEHLLK | ||||
LKNNHCDQLT | VKLKQMENMV | SVLQNELSET | KKTKLQLELQ | KIEWEKELYD | ||||
LRLALKQENE | EKRNADMLYN | KDSEQLRIKE | EECGKVVETK | QQLKWNLRRL | ||||
VKELRTVRNN | LDLVVQERND | AQKQLSEEQD | ARILQDQILT | SKQKELEMAR | ||||
KKMNSEISHR | HQKEKDLFHE | DCMLQEEIAL | LRLEIDTIKN | QNKQKEKKYF | ||||
EDIEAVKEKN | DNLQKIIKLN | EETLTETILQ | YSGQLNNLTA | ENKILNSELE | ||||
NGKQNQERLE | IEMESYRCRL | AAAVRDCDQS | QTARDLKLDF | QRTRQEWVRL | ||||
HDKMKVDMSG | LQAKNEILSE | KLSNAESKIN | SLQIQLHNTR | DALGRESLIL | ||||
ERVQRDLSQT | QCQKKETEQM | YQIEQSKLKK | YIAKQESVEE | RLSQLQSENM | ||||
LLRQQLDDAH | KKANSQEKTS | STIQDQFHSA | AKNLQAESEK | QILSLQEKNK | ||||
ELMDEYNHLK | ERMDQCEKEK | AGRKIDLTEA | QETVPSRCLH | LDAENEVLQL | ||||
QQTLFSMKAI | QKQCETLQKN | KKQLKQEVVN | LKSYMERNML | ERGKAEWHKL | ||||
LIEERARKEI | EEKLNEAILT | LQKQAAVSHE | QLVQLREDNT | TSIKTQMELT | ||||
IKDLESEISR | IKTSQADFNK | TELERYKELY | LEEVKVRESL | SNELSRTNEM | ||||
IAEVSTQLTV | EKEQTRSRSL | FTAYATRPVL | ESPCVGNLND | SEGLNRKHIP | ||||
RKKRSALKDM | ESYLLKMQQK | LQNDLTAEVA | GSSQTGLHRI | PQCSSFSSSS | ||||
LHLLLCSICQ | PFFLILQLLL | NMNLDPI |
- Simboli
C: Cistein
D: Asparaginska kiselina
E: Glutaminska kiselina
F: Fenilalanin
G: Glicin
H: Histidin
I: Izoleucin
K: Lizin
L: Leucin
M: Metionin
N: Asparagin
P: Prolin
Q: Glutamin
R: Arginin
S: Serin
T: Treonin
V: Valin
W: Triptofan
Y: Tirozin
Domeni
[uredi | uredi izvor]Ovaj protein ima domen nepoznate funkcije (DUF) 3496, koji je u eukariota konzerviran.[21] Domen DUF3496 nalazi se iz aminokiselina 547-622.[9] CCDC144A, alias ovog gena, ukazuje na to da unutar proteina treba postojati domen upredena zavojnica. Upredene zavojnice su strukturni motivi u proteinima u kojima su zajedno savijena još dva alfa-heliksa, koji obično sadrže heptadni ponavljač, hxxhcxc ili hidrofobne (h) i aminokiselinske ostatke naboja (c).[7] Neprevedena područja 5'i 3' nukleotidne sekvence ovog gena bogata su strukturama matične petlje.[22] Umjesto upredene zavojnice pronađen je i leucinski zatvarač.[11] Ostaci 478-499, "LHNTRDALGRESLILERVQRDL", su oni koji čine obrazac patentnog leucinskog zatvarača .[11] Struktura ovog proteina sastoji se uglavnom od alfa-heliksa, sa nekim slučajnim zavojnicama.[23]
Evolucija
[uredi | uredi izvor]Broj | Vrsta |
---|---|
1 | Devetoprugasti armadilo |
2 | Goveče |
3 | Ledteća lisica |
4 | Mišouhi šišmiš |
5 | Čimpanza |
6 | Verirovka |
7 | Kućni miš |
8 | Kineski hrčak |
9 | Goli krtičasti pacov |
10 | Rezus majmun |
11 | Rakojedi makak |
12 | Ljudski KIAA0565 |
13 | Kljunar |
14 | Zašpadna ksndžasta žaba |
15 | Riba pufer |
16 | Karolinska anola |
17 | Zebrasta zeba |
Ortolozi proteina KIAA0565 identificirani su uglavnom kod sisara, ali i nekih ptica, gmizavaca, vodozemaca i riba.[24]
Potencijalni ortolozi
[uredi | uredi izvor]Protein | Rod i vrsta | Uobičajeno imeCommon name | Ortologni prostor | Naslovni upit (%) | Maksimalni identitet (%) | Pristupni broj |
---|---|---|---|---|---|---|
CCDC 144A | Macaca fasicularis | Rakojedi makak | 0 | 97 | 86 | EHH57800.1[9] |
CCDC 144A, parcijalni | Macaca mulatta | Rezus majmun | 0 | 97 | 86 | EHH24608.1[9] |
ANKRD 26 | Pan troglodytes | Obični čumpanza | 2e-160 | 96 | 67 | JAA07196.1[9] |
ANKRD 26, pretpostavljeni | Dasypus novemcinctus | Devetoprugi armadilo | 1e-158 | 96 | 65 | XP_004470808.1[9] |
ANKRD 26 | Myotis davidii | Mišouhi šišmiš | 2e-154 | 96 | 64 | ELK35935.1[9] |
ANKRD 26 | Bos taurus | Goveče | 2e-157 | 96 | 63 | NP_001107239.1[9] |
ANKRD 26 | Tupaia chinensis | Verirovka | 3e-147 | 96 | 62 | ELW73004.1[9] |
ANKRD 26 | Cricetulus griseus | Kineski hrčak | 1e-145 | 96 | 60 | EGW08323.1[9] |
ANKRD 26 | Heterocephalus glaber | Goli krtičasti pacov | 2e-138 | 96 | 59 | EHB01988.1[9] |
ANKRD 26 | Mus musculus | Kujćni miš | 4e-141 | 96 | 57 | NP_001074581.1[9] |
ANKRD 26, parcijalni | Pteropus alecto | Crna leteća lisica | 2e-171 | 97 | 51 | ELK03279.1[9] |
ANKRD 26-oliki, pretpostaljeni | Ornithorhynchus anatinus | Kljunar | 2e-108 | 96 | 51 | XP_001509663.2[9] |
ANKRD 26-oliki, pretpostaljeni | Taeniopygia guttata | Zebrasta zeba | 3e-88 | 92 | 45 | XP_004177264.1[9] |
ANKRD 26-oliki, pretpostaljeni | Anolis carolinensis | Karolinska anola | 2e-75 | 97 | 44 | XP_003221333.1[9] |
ANKRD 26, pretpostaljeni | Xenopus tropicalis | Zapadna kandžasta žaba | 2e-78 | 98 | 44 | XP_002935004.1[9] |
Neimenovani preoteinski proizvod | Tetraodon nigroviridis | Riba pufer | 1e-28 | 98 | 34 | CAF98417.1[9] |
Klinički značaj
[uredi | uredi izvor]Ovaj gen povezan je sa Smith-Magenisovim sindromom (SMS), koji je poznat i kao delecijski sindrom hromosoma 17p11.2,[25] sindrom delecije hromosoma 17p ,[26] sindrom delecije 17p,[26] parcijalna monosomija 17p[26] i delecijska abnormalnost.[27][28]
Interaktivni proteini
[uredi | uredi izvor]Potencijalno mogu postojati dva proteina koja djeluju u interakciji s KIAA0565, a to su ubikvitin specifična peptidaza 32 (USP32) i ubikvitin specifična peptidaza 25 (USP25).[29]
Ekspresija
[uredi | uredi izvor]Pokazalo se da ovaj protein ima relativno nisku ekspresiju u svim tkivima.[30]
Reference
[uredi | uredi izvor]- ^ a b c GRCh38: Ensembl release 89: ENSG00000170160 - Ensembl, maj 2017
- ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ "NCBI: Gene".
- ^ "NeXtProt".
- ^ "NCBI".
- ^ "NCBI: Gene".
- ^ a b "GeneCards".
- ^ "GenBank: The Human Gene Compendium".
- ^ a b c d e f g h i j k l m n o p q r "NCBI: Protein".
- ^ a b "Biology Workbench". Arhivirano s originala, 11. 8. 2003. Pristupljeno 7. 6. 2021.
- ^ a b c "PSORTII".
- ^ "SOSUI Hydrophobicity". Arhivirano s originala, 18. 3. 2004. Pristupljeno 11. 5. 2013.
- ^ "ExPASy: SignalP".
- ^ "ExPASy: NetPhos".
- ^ "ExPASy: Sulfinator".
- ^ "ExPASy: SUMOplot".
- ^ "ExPASy: SUMOsp". Arhivirano s originala, 10. 5. 2013. Pristupljeno 7. 6. 2021.
- ^ "ExPASy: Myristoylator".
- ^ "ExPASy: NetNGlyc".
- ^ "UniProt, A2RUR9". Pristupljeno 12. 9. 2017.
- ^ "The European Bioinformatics Institute".
- ^ "MFOLD".
- ^ "PELE: Biology Workbench".
- ^ a b "BLASTp".
- ^ "NIH Rare Diseases".
- ^ a b c "Genetics Home Reference".
- ^ "Unified Medical Language System".
- ^ "MalaCards".
- ^ "Search Tool for the Retrieval of Interacting Genes/Proteins".
- ^ "GEO Profiles".
Vanjski linkovi
[uredi | uredi izvor]- Lokacija ljudskog genoma CCDC144A i stranica sa detaljima o genu CCDC144A u UCSC Genome Browseru.